ПРОДУКТЫ   СКАЧАТЬ КУПИТЬ ПОМОЩЬ БЛОГ  О КОМПАНИИ  
 
Основные свойства
PDF в Word, RTF
PDF в Word, DOCX
PDF в картинки: JPEG, TIFF
PDF в HTML
PDF в Excel
PDF в XML
>>PDF в Text
Скачать пробную версию
Купить
Online-demo
Справочник по API
История версий
Учебные примеры и статьи
How to convert PDF to JPG with high Quality in C# and .Net.
How to convert PDF to Word in C#.
How to convert PDF to Jpeg in C#.
Extract Text from PDF in C#.
How to convert PDF to Multipage TIFF in C#.
How to convert PDF to Black-White Multipage TIFF in C#.
Delphi.Net – How to convert PDF to Word.
How to convert a password protected PDF document.

"Simple way to extract Text from PDF in C# .Net?"

Simple way to extract Text from PDF in C# .Net?

Introduction

     If you are looking for a .Net library to extract text data from PDF, you are in the right place. PDF Focus .Net helps you extract text from any PDF document.

To illustrate how to easily extract text from PDF, let's look at simple code in C#:
            SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();

            f.OpenPdf(@"c:\Pushkin Poems.pdf");

            if (f.PageCount > 0)
            {                
                f.ToText(@"c:\Pushkin Poems.txt");
            }       
          
You will be able extract a text from a whole document or from specific pages. The library extracts good-looking text without unwanted spaces between the letters in words and supports Unicode symbols.

Furthermore, a text layout looks the same as in the RTF with proper line breaks and columns.


Nuget   Online Demo   Скачать, 7.1 (17 09, 2019)



Есть вопрос?

Если у вас есть вопросы, нужна помощь или пример кода: обращайтесь в нашу службу поддержки по адресу support@sautinsoft.com.



Основные преимущества PDF Focus .Net:

  1. Экономия времени и никаких затрат на разработку продукта. Написание собственного конвертера PDF в c# требует много дней напряженной работы и занимает около 100 000 C# строк кода. PDF Focus .NET с экономит много времени, и нужно только добавить ссылку на "SautinSoft.PdfFocus.dll" и написать 3-4 C# строки кода.

  2. PDF Focus .Net предоставляет набор API для конвертирования PDF в различных форматах сразу: Word, DOCX, RTF, Excel, HTML, текст, многостраничный TIFF, JPEG, PNG.

  3. Программа является абсолютно автономной библиотеке PDF, клиенты могут не иметь Adobe Acrobat, MS Word, Excel или другого программного обеспечения.

  4. Программное обеспечение будет иметь один из самых быстрых API для конвертирования PDF-файлов, здесь вы можете проверить.

  5. Можно выбрать любой из выпусков продукта: Total, Office, HTML и Picasso. Это сэкономит вложения. Если вам нужен только API для преобразования PDF в HTML и вы не нуждаетесь в других функциях, можно рассмотреть "HTML" PDF Focus .Net. Это намного дешевле, чем у конкурентов.

  6. Вы оплачиваете один раз и можно пользоваться без каких-либо дополнительных сборов. «PDF Focus .Net» Лицензия никогда не истекает .

  7. В качестве бонуса, вы получате неограниченную техническую поддержку независимо от даты моего приобретения.

Some examples to convert RTF to Text in C# and VB.Net

1. Convert RTF file to Text using C#:

            SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
	
            f.OpenPdf(@"d:\Cook Book.pdf");

            if (f.PageCount > 2)
            {
                //Convert only pages from 2 to 3 in Text
                f.ToText(@"d:\Cook Book.txt", 2, 3);
            }
2. Convert whole PDF document to Text in memory using C#:
            SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();

            //Read PDF to byte array
            byte[] pdf = File.ReadAllBytes(@"d:\Sample.pdf");

            f.OpenPdf(pdf);

            if (f.PageCount > 0)
            {
                string text = f.ToText();

                //Save to text file
                File.WriteAllText(@"d:\Sample.txt", text);
            }
3. Extract Text from all pages of PDF in ASP.Net/VB.Net:
        Dim f As New SautinSoft.PdfFocus()
        Dim url As New Uri("http://www.website.com/sample.pdf")
	
        f.OpenPdf(url)

        If f.PageCount > 0 Then
            'Convert whole PDF to Text (extract text from PDF)
            Dim text As String = f.ToText()

            'show text
            TextBox1.Text = Text

        Else
            TextBox1.Text = "Converting failed!"
        End If
4. Convert 1st page of PDF to Text in VB.Net:
        Dim f As New SautinSoft.PdfFocus()

        Dim pdf() As Byte = File.ReadAllBytes("d:\Simple.pdf")
        Dim text As String = ""

        f.OpenPdf(pdf)

        If f.PageCount > 0 Then
            text = f.ToText(1, 1)

            'show text
            If text <> "" Then
                TextBox1.Text = text
            End If
        End If
If anyone needs a code sample in C#, VB.Net, ASP.Net etc "How to extract Text from PDF", email us at support@sautinsoft.ru or ask at Online Chat (right-bottom corner of this page). We'll help you certainly!


Требования и техническая информация

     Требуется только .Net 4.0 или выше. Наш продукт совместим со всеми языками .Net и поддерживает все операционные системы, в которых могут использоваться .NET Framework и .Net Core. Обратите внимание, что PDF Focus .Net полностью написан на управляемом C #, что делает его абсолютно автономным и независимой библиотекой.

.Net Framework 4.0 and higher and .Net Core 1.1 and higher

.Net Framework 4.0, 4.5, 4.6.1 и выше. Старую версию .Net 2.0 можно найти здесь.

.Net Core 1.1 и выше.



Reasonable prices

     Библиотека предлагает разработчикам высококачественную конверсию по оптимальной цене. Главное отличие в том, что PDF Focus .Net дешевле, чем все его более или менее популярные компоненты. Например, одна лицензия для PDF Focus .Net - HTML Edition стоит $399, а цена на Total Edition от $578.


Скачать

Чтобы увидеть функциональность из первых рук, скачайте самые свежие «PDF Focus .Net» с примерами кода, 24.1 Mb.

 
 
Программы Скачать Помощь О компании
SautinSoft on Facebook SautinSoft on Twitter SautinSoft on Youtube Our Blog
Авторское право © 2002 - 2019 SautinSoft (начало с сайта sautin.com). Все права защищены.