Преобразование PDF в XML на C# с помощью компонента PDF Focus .Net
Поддерживает все PDF 1.0-1.7;
Конвертирует PDF в файл, поток,URI-код или байтовый массив;
Производит правильно построенный XML-документ;
Предлагает два режима преобразования: преобразование всего текста или только табличных данных.
Введение
Одной из возможностей компонента «PDF Focus .Net» является конвертирование файлов PDF-формата в XML-формат. Для этого необходимо только добавить ссылку на сборку "SautinSoft.PdfFocus.dll". Вы можете скачать её здесь, 99.0 Mb. Или установить пакет с NuGet.
Рассмотрим простой пример, как добавить функцию "PDF to XML" в любое приложение .NET на C#:
SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.XmlOptions.ConvertNonTabularDataToSpreadsheet = false;
f.OpenPdf(@"c:\Table.pdf");
f.ToXml(@"c:\Table.xml");
После запуска этого кода Вы получите XML-документ, созданный из PDF-таблиц.
Поскольку мы присвоили опции "ConvertNonTabularDataToSpreadsheet" значение false - все текстовые данные будут пропущены. Т.е. только таблицы будут преобразованы в XML.
Компонент совместим со всеми языками .NET и поддерживает основные операционные системы.
Windows
Linux
Mac OS
Обратите внимание, что «PDF Focus .Net» полностью написан на управляемом C#. Это делает его абсолютно автономным и независимым.
.NET Framework 4.0, 4.5, 4.6.1 и выше. Старую версию .NET 2.0 можно найти здесь.
.NET Core 2.0 и выше.
Некоторые примеры преобразования PDF в XML на C# и VB.Net
1. Конвертирование PDF-файла в XML-файл на C#:
string pathToPdf = @"c:\Table.pdf";
string pathToXml = Path.ChangeExtension(pathToPdf, ".xml");
// Convert PDF file to XML file.
SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
// This property is necessary only for registered version.
//f.Serial = "XXXXXXXXXXX";
// Let's convert only tables to XML and skip all textual data.
f.XmlOptions.ConvertNonTabularDataToSpreadsheet = false;
f.OpenPdf(pathToPdf);
if (f.PageCount > 0)
{
int result = f.ToXml(pathToXml);
//Show HTML document in browser
if (result==0)
{
System.Diagnostics.Process.Start(pathToXml);
}
}
2. Конвертирование PDF-файла в XML-файл на VB.Net:
Dim pathToPdf As String = @"c:\Table.pdf"
Dim pathToXml As String = Path.ChangeExtension(pathToPdf, ".xml")
' Convert PDF file to XML file.
Dim f As New SautinSoft.PdfFocus()
' This property is necessary only for registered version.
'f.Serial = "XXXXXXXXXXX";
' Let's convert only tables to XML and skip all textual data.
f.XmlOptions.ConvertNonTabularDataToSpreadsheet = False
f.OpenPdf(pathToPdf)
If f.PageCount > 0 Then
Dim result As Integer = f.ToXml(pathToXml)
'Show HTML document in browser
If result = 0 Then
System.Diagnostics.Process.Start(pathToXml)
End If
End If
Есть вопрос?
Если у Вас есть вопросы,
нужна помощь
или пример кода как конвертировать на C#, VB.NET, ASP.NET,
обращайтесь в нашу службу поддержки по адресу support@sautinsoft.com или спросите в онлайн-чате (правый нижний угол этой страницы). Мы Вам обязательно поможем!
Основные преимущества «PDF Focus .Net»:
Экономия времени и никаких затрат на разработку продукта.
Написание собственного конвертера PDF на C# требует много дней напряженной работы и занимает около 100000 строк кода. «PDF Focus .Net» сэкономит Ваше время, нужно лишь добавить ссылку на "SautinSoft.PdfFocus.dll" и написать 3-4 C# строки кода.
«PDF Focus .Net» предоставляет набор API для конвертирования PDF в различных форматах сразу: Word, DOCX, RTF, Excel, HTML, текст, многостраничный TIFF, JPEG, PNG.
«PDF Focus .Net» является абсолютно автономным компонентом PDF.
Клиенты могут не иметь Adobe Acrobat, MS Word, Excel или другого программного обеспечения.
Программное обеспечение будет иметь один из самых быстрых API для конвертирования PDF-файлов, здесь Вы можете проверить.
Например, если Вам нужен только API для преобразования PDF в HTML и Вы не нуждаетесь в других функциях, можно рассмотреть «PDF Focus .Net - HTML Edition». Это сэкономит вложения.
Вы оплачиваете один раз и можно пользоваться «PDF Focus .Net» без каких-либо дополнительных сборов. Лицензия никогда не истекает .
В качестве бонуса Вы получате неограниченную техническую поддержку независимо от даты Вашего приобретения.