горизонтально расположенные полосы: белая, синяя, красная

Конвертирование PDF-документов в HTML-формат

  • Поддерживает все PDF 1.0-1.7;
  • Конвертирует защищенные паролем документы;
  • Конвертирует заданный диапазон PDF-страниц;
  • Производит HTML5 c CSS;
  • Позволяет хранить изображения внутри HTML, используя "Base64";
  • Совместим с Chrome, Firefox, IE.
<br />
<b>Notice</b>:  Undefined variable: titlepage in <b>C:\inetpub\wwwroot\sautinsoft.ru\products\pdf-focus\pdftohtml.php</b> on line <b>62</b><br />

SautinSoft.PdfFocus предоставляет API для конвертирования PDF-документов в HTML5.

  • Поддерживает все PDF 1.0-1.7;
  • Конвертирует защищенные паролем документы (при наличии пароля);
  • Позволяет конвертировать заданный диапазон PDF-страниц;
  • Производит HTML5 c CSS;
  • Позволяет хранить изображения внутри HTML, используя "Base64";
  • Совместим с Chrome, Firefox, IE.
  • Все HTML-документы, созданные с использованием SautinSoft.PdfFocus.dll полностью совместимы со стандартами W3C Markup validation service.

Вы можете выбрать один из двух режимов преобразования:

  • HTML-Fixed лучше использовать для рендеринга, потому что он полностью повторяет макет PDF со структурой страниц.

    Разметка таких документов очень сложна и содержит множество тегов, стилизованных под координаты (x,y).

  • HTML-Flowing лучше подходит для дальнейшей обработки человеком: редактирования и объединения.

    Разметка таких документов очень проста внутри.

Загрузка

DEMO-версия бесплатна.

структура html-документов

Посмотрите на очень простой пример как добавить функцию преобразования PDF в HTML в любое .NET-приложение:

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.OpenPdf(@"d:\Odyssey.pdf");
f.ToHtml(@"d:\Odyssey.html");

SautinSoft.PdfFocus может генерировать HTML-документы со встроенными изображениями с использованием алгоритма "Base64". Учитывая этот факт, Вы можете конвертировать PDF в HTML полностью в памяти без файловой системы:

<html>
  <head>...</head>
  <body>
    <div style="position:relative;margin: 0px 0px">Homer is the author of the Iliad and the Odyssey ...</div>
    <div style="">
      <img src="data:image/gif;base64,R0lGODlhUAAPAKIAAAsL...">
    </div>
  </body>
</html>

Настройте результат преобразования PDF в HTML

текст, код, схемы и изображения в таблице текст, код, схемы и изображения в таблице текст, код, схемы и изображения в таблице

Некоторые примеры преобразования PDF в HTML на C# и VB.NET

1. Конвертировать PDF в HTML на C#:

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.OpenPdf(@"d:\History.pdf");
if (f.PageCount > 0)
{
  int result = f.ToHtml(@"d:\History.html");
  //Open HTML document
  if (result==0)
  {
    System.Diagnostics.Process.Start(@"d:\History.html");
  }
}

2. Конвертировать PDF в HTML в памяти с помощью С#:

byte[] pdf = File.ReadAllBytes(@"c:\Book.pdf");

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.OpenPdf(pdf);
if (f.PageCount > 0)
{
  f.HtmlOptions.IncludeImageInHtml = true;
  f.HtmlOptions.Title = "Simple text";
  string html = f.ToHtml();
  //now the variable 'html' contains HTML document
}

3. Экспорт PDF в HTML на ASP.NET/C#:

SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
f.OpenPdf(FileUpload1.FileBytes);
string html = String.Empty;
if (f.PageCount > 0)
{
  //Let's whole PDF document to HTML
  f.HtmlOptions.IncludeImageInHtml = true;
  html = f.ToHtml();
}
//show HTML
if (html != "")
{
  Response.Buffer = true;
  Response.Clear();
  Response.ContentType = "application/msword";
  Response.AddHeader("Content-Disposition:", "attachment; filename=Result.doc");
  Response.Write(rtf);
  Response.Flush();
  Response.End();
}

4. Конвертировать PDF-файл в HTML-файл на VB.NET:

Dim f As New SautinSoft.PdfFocus()
f.OpenPdf("c:\Simple Text.pdf")
If f.PageCount > 0 Then
  Dim result As Integer = f.ToHtml("c:\Result.html")
  'Show HTML document
  If result = 0 Then
    System.Diagnostics.Process.Start("c:\Result.html")
  End If
End If

Больше примеров кода смотрите здесь.

Есть вопрос?

стоящий в позе задумчивости человечек у красного знака вопроса выше его роста
  • Если у вас есть вопросы,
  • нужна помощь
  • или пример кода,

обращайтесь в нашу службу поддержки по адресу: [email protected] или спросите в онлайн-чате (правый нижний угол этой страницы). Мы Вам обязательно поможем!

Другие функции SautinSoft.PdfFocus

PDF в DOCX PDF в RTF ✦ PDF в HTML PDF в Img PDF в Excel PDF в XML PDF в Text OCR
 ВВЕРХ