горизонтально расположенные полосы: белая, синяя, красная

Конвертирование PDF-документов в текстовый формат

  • Поддерживает все PDF 1.0-1.7, PDF/A;
  • Конвертирует защищенные паролем документы;
  • Конвертирует заданный диапазон PDF-страниц;
  • Извлекает текст из PDF;
  • Поддерживает символы Юникода.
схема перехода красного круга с надписью PDF в серый прямоугольник с надписью Text

SautinSoft.PdfFocus предоставляет API для конвертирования PDF-документов в текстовый формат.

  • Поддерживает все PDF 1.0-1.7, PDF/A;
  • Конвертирует защищенные паролем документы (при наличии пароля);
  • Позволяет конвертировать заданный диапазон PDF-страниц;
  • Извлекает текст из целого PDF-документа или с отдельных его страниц;
  • Библиотека извлекает красивый текст без нежелательных пробелов между буквами в словах.
  • Поддерживает символы Юникода.
  • Текстовый макет выглядит так же, как в RTF - с правильными разрывами строк и столбцами.

Загрузка

DEMO-версия бесплатна.

Теперь Вам нужно только добавить ссылку на файл .dll (или установить пакет с NuGet) и ввести 4 строки кода.

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.OpenPdf(@"c:\Pushkin Poems.pdf");
if (f.PageCount > 0)
{
  f.ToText(@"c:\Pushkin Poems.txt");
}

Некоторые примеры преобразования PDF в Text на C# и VB.NET

1. Конвертировать PDF в .txt на C#:

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.OpenPdf(@"d:\Cook Book.pdf");
if (f.PageCount > 2)
{
  //Convert only pages from 2 to 3 in Text
  f.ToText(@"d:\Cook Book.txt", 2, 3);
}

2. Конвертировать PDF в текст в памяти с помощью С#:

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();

//Read PDF to byte array
byte[] pdf = File.ReadAllBytes(@"d:\Sample.pdf");
f.OpenPdf(pdf);
if (f.PageCount > 0)
{
  string text = f.ToText();
  //Save to text file
  File.WriteAllText(@"d:\Sample.txt", text);
}

3. Извлечение текста со всех страниц PDF на ASP.NET/VB.NET:

Dim f As New SautinSoft.PdfFocus()
Dim url As New Uri("http://www.website.com/sample.pdf")
f.OpenPdf(url)

If f.PageCount > 0 Then
  'Convert whole PDF to Text (extract text from PDF)
  Dim text As String = f.ToText()
  'show text
  TextBox1.Text = Text
Else
  TextBox1.Text = "Converting failed!"
End If

4. Конвертирование 1-ой страницы PDF-документа в текст на VB.NET:

Dim f As New SautinSoft.PdfFocus()
Dim pdf() As Byte = File.ReadAllBytes("d:\Simple.pdf")
Dim text As String = ""
f.OpenPdf(pdf)

If f.PageCount > 0 Then
  text = f.ToText(1, 1)
  'show text
  If text <> "" Then
    TextBox1.Text = text
  End If
End If

Больше примеров кода смотрите здесь.

Есть вопрос?

стоящий в позе задумчивости человечек у красного знака вопроса выше его роста
  • Если у вас есть вопросы,
  • нужна помощь
  • или пример кода,

обращайтесь в нашу службу поддержки по адресу: [email protected] или спросите в онлайн-чате (правый нижний угол этой страницы). Мы Вам обязательно поможем!

Другие функции SautinSoft.PdfFocus

PDF в DOCX PDF в RTF PDF в HTML PDF в Img PDF в Excel PDF в XML ✦ PDF в Text OCR
 ВВЕРХ