ПРОДУКТЫСКАЧАТЬ  КУПИТЬ  ПОМОЩЬ БЛОГ   О КОМПАНИИ  
 
Визитная карточка
PDF в DOCX
PDF в RTF
PDF в картинки: JPEG, TIFF
PDF в HTML
PDF в Excel
>>PDF в XML
PDF в Text
Скачать пробную версию
Купить
Online-demo
Справочник по API
История версий
Учебные примеры и статьи
How to convert PDF to JPG with high Quality in C# and .Net.
How to convert PDF to Word in C#.
How to convert PDF to Jpeg in C#.
Extract Text from PDF in C#.
How to convert PDF to Multipage TIFF in C#.
How to convert PDF to Black-White Multipage TIFF in C#.
Delphi.Net – How to convert PDF to Word.
How to convert a password protected PDF document.

Преобразование PDF в XML на C#
с помощью компонента PDF Focus .Net

  • Поддерживает все PDF 1.0-1.7;
  • Конвертирует PDF в файл, поток,URI-код или байтовый массив;
  • Производит правильно построенный XML-документ;
  • Предлагает два режима преобразования: преобразование всего текста или только табличных данных.

Введение

Одной из возможностей компонента «PDF Focus .Net» является конвертирование файлов PDF-формата в XML-формат. Для этого необходимо только добавить ссылку на сборку "SautinSoft.PdfFocus.dll". Вы можете скачать её здесь, 104.0 Mb. Или установить пакет с NuGet.

Рассмотрим простой пример, как добавить функцию "PDF to XML" в любое приложение .NET на C#:

            SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
            f.XmlOptions.ConvertNonTabularDataToSpreadsheet = false;
            f.OpenPdf(@"c:\Table.pdf");
            f.ToXml(@"c:\Table.xml");
			
          
После запуска этого кода Вы получите XML-документ, созданный из PDF-таблиц.

Поскольку мы присвоили опции "ConvertNonTabularDataToSpreadsheet" значение false - все текстовые данные будут пропущены. Т.е. только таблицы будут преобразованы в XML.


<document>
  <page index="1">
    <table>
      <tgroup cols="5">
        <row>
          <entry rowspan="2">September</entry>
          <entry colspan="2">October</entry>
          <entry colspan="2">November</entry>
        </row>
      </tgroup>
    </table>
  </page>
</document>

Таким образом, Вы можете настроить компонент, чтобы получить такой XML-документ, какой хотите.
Проверьте это сами! 



NuGet   Online Demo   Скачать, 7.5.3.27 (Март 27, 2020)



Системные требования

Компонент совместим со всеми языками .NET и поддерживает основные операционные системы.

  • Windows
  • Linux
  • Mac OS

Обратите внимание, что «PDF Focus .Net» полностью написан на управляемом C#. Это делает его абсолютно автономным и независимым.

.NET Framework 4.0 and higher and .Net Core 2.0 and higher

.NET Framework 4.0, 4.5, 4.6.1 и выше. Старую версию .NET 2.0 можно найти здесь.

.NET Core 2.0 и выше.

Некоторые примеры преобразования PDF в XML на C# и VB.Net

1. Конвертирование PDF-файла в XML-файл на C#:
            
            string pathToPdf = @"c:\Table.pdf";
            string pathToXml = Path.ChangeExtension(pathToPdf, ".xml");

            // Convert PDF file to XML file.
            SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();

	    	// This property is necessary only for registered version.
		    //f.Serial = "XXXXXXXXXXX";

            // Let's convert only tables to XML and skip all textual data.
            f.XmlOptions.ConvertNonTabularDataToSpreadsheet = false;

            f.OpenPdf(pathToPdf);

            if (f.PageCount > 0)
            {
                int result = f.ToXml(pathToXml);
                
                //Show HTML document in browser
                if (result==0)
                {
                    System.Diagnostics.Process.Start(pathToXml);
                }
            }
      
	  
2. Конвертирование PDF-файла в XML-файл на VB.Net:
            
        Dim pathToPdf As String = @"c:\Table.pdf"
        Dim pathToXml As String = Path.ChangeExtension(pathToPdf, ".xml")

        ' Convert PDF file to XML file.
        Dim f As New SautinSoft.PdfFocus()

        ' This property is necessary only for registered version.
        'f.Serial = "XXXXXXXXXXX";

        ' Let's convert only tables to XML and skip all textual data.
        f.XmlOptions.ConvertNonTabularDataToSpreadsheet = False

        f.OpenPdf(pathToPdf)

        If f.PageCount > 0 Then
            Dim result As Integer = f.ToXml(pathToXml)

            'Show HTML document in browser
            If result = 0 Then
                System.Diagnostics.Process.Start(pathToXml)
            End If
        End If
      
	  


Есть вопрос?

  • Если у Вас есть вопросы,
  • нужна помощь
  • или пример кода как конвертировать на C#, VB.NET, ASP.NET,
обращайтесь в нашу службу поддержки по адресу support@sautinsoft.com или спросите в онлайн-чате (правый нижний угол этой страницы). Мы Вам обязательно поможем!


Основные преимущества «PDF Focus .Net»:

  1. Экономия времени и никаких затрат на разработку продукта.

    Написание собственного конвертера PDF на C# требует много дней напряженной работы и занимает около 100000 строк кода. «PDF Focus .Net» сэкономит Ваше время, нужно лишь добавить ссылку на "SautinSoft.PdfFocus.dll" и написать 3-4 C# строки кода.

  2. «PDF Focus .Net» предоставляет набор API для конвертирования PDF в различных форматах сразу: Word, DOCX, RTF, Excel, HTML, текст, многостраничный TIFF, JPEG, PNG.

  3. «PDF Focus .Net» является абсолютно автономным компонентом PDF.
    Клиенты могут не иметь Adobe Acrobat, MS Word, Excel или другого программного обеспечения.

  4. Программное обеспечение будет иметь один из самых быстрых API для конвертирования PDF-файлов, здесь Вы можете проверить.

  5. Можно выбрать любой из выпусков продукта: Total, Office, HTML или Picasso.

    Например, если Вам нужен только API для преобразования PDF в HTML и Вы не нуждаетесь в других функциях, можно рассмотреть «PDF Focus .Net - HTML Edition». Это сэкономит вложения.

  6. Вы оплачиваете один раз и можно пользоваться «PDF Focus .Net» без каких-либо дополнительных сборов. Лицензия никогда не истекает .

  7. В качестве бонуса Вы получате неограниченную техническую поддержку независимо от даты Вашего приобретения.

Если Вас заинтересовал наш продукт, Вы можете скачать демо-версию тут или посмотреть цены на «PDF Focus .Net».

 
 
Программы Скачать Помощь О компании
SautinSoft on Facebook SautinSoft on Twitter SautinSoft on Youtube Our Blog
Авторское право © 2002 - 2020 SautinSoft (начало с сайта sautin.com). Все права защищены.