Как преобразовать PDF в XML в памяти на C# и .NET
Приложение показывает, как конвертировать в памяти все табличные и даже текстовые данные из PDF в XML. Выходной XML будет представлен как System.String.
Полный код
using System;
using System.IO;
namespace Sample
{
class Sample
{
static void Main(string[] args)
{
// Before starting, we recommend to get a free 100-day key:
// https://sautinsoft.com/start-for-free/
// Apply the key here:
// SautinSoft.PdfFocus.SetLicense("...");
string pathToPdf = Path.GetFullPath(@"..\..\..\Table.pdf");
string pathToXml = "Result.xml";
byte[] pdf = File.ReadAllBytes(pathToPdf);
string xml = null;
// Convert PDF file to XML file.
SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.OpenPdf(pdf);
if (f.PageCount > 0)
{
xml = f.ToXml();
//Show XML document in browser
if (!String.IsNullOrEmpty(xml))
{
File.WriteAllText(pathToXml,xml);
System.Diagnostics.Process.Start(new System.Diagnostics.ProcessStartInfo(pathToXml) { UseShellExecute = true });
}
}
}
}
}
Imports System.IO
Imports System.Drawing.Imaging
Imports System.Collections.Generic
Imports SautinSoft
Module Sample
Sub Main()
' Before starting, we recommend to get a free 100-day key:
' https://sautinsoft.com/start-for-free/
' Apply the key here
' SautinSoft.PdfFocus.SetLicense("...");
Dim pathToPdf As String = Path.GetFullPath("..\..\..\Table.pdf")
Dim pathToXml As String = "Result.xml"
Dim pdf() As Byte = File.ReadAllBytes(pathToPdf)
Dim xml As String = Nothing
' Convert PDF file to XML file.
Dim f As New SautinSoft.PdfFocus()
f.OpenPdf(pdf)
If f.PageCount > 0 Then
xml = f.ToXml()
'Show XML document in browser
If Not String.IsNullOrEmpty(xml) Then
File.WriteAllText(pathToXml, xml)
System.Diagnostics.Process.Start(New System.Diagnostics.ProcessStartInfo(pathToXml) With {.UseShellExecute = True})
End If
End If
End Sub
End Module
Если вам нужен пример кода или у вас есть вопрос: напишите нам по адресу support@sautinsoft.com или спросите в онлайн-чате (правый нижний угол этой страницы) или используйте форму ниже: