SautinSoft.PdfFocus предоставляет API для конвертирования PDF-документов в текстовый формат.
- Поддерживает все PDF 1.0-1.7, PDF/A;
- Конвертирует защищенные паролем документы (при наличии пароля);
- Позволяет конвертировать заданный диапазон PDF-страниц;
- Извлекает текст из целого PDF-документа или с отдельных его страниц;
- Библиотека извлекает красивый текст без нежелательных пробелов между буквами в словах.
- Поддерживает символы Юникода.
- Текстовый макет выглядит так же, как в RTF - с правильными разрывами строк и столбцами.
Теперь Вам нужно только добавить ссылку на файл .dll (или установить пакет с NuGet) и ввести 4 строки кода.
SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.OpenPdf(@"c:\Pushkin Poems.pdf");
if (f.PageCount > 0)
{
f.ToText(@"c:\Pushkin Poems.txt");
}