Обзор SautinSoft.HtmlToRtf


Вступление

SautinSoft.HtmlToRtf это кроссплатформенная .NET-библиотека которая позволяет Вашим приложениям конвертировать любые HTML документы в Word, RTF, DOCX, Текст. После добавления ссылки на "SautinSoft.HtmlToRtf.dll" и ввода 3-4 строк C# Вы можете использовать API в своих приложениях:

Входные форматы

HTML-документы. Компонент может читать и анализировать все типы HTML: HTML 3.2, HTML 4.01, HTML 5 с CSS и XHTML. Наш компонент не требует какой-либо специальной версии формата HTML, он будет работать с любой версией. Компонент имеет собственный парсер HTML.

Языки сценариев (например, JQuery, JavaScript) не поддерживаются. Если Вы хотите конвертировать HTML (JavaScript и сложным CSS), в PDF формат, используйте другой наш компонент — SautinSoft.PdfVision.

Эти CSS теперь поддерживаются текущей версией «SautinSoft.HtmlToRtf»:

css html

Выходные форматы

  • DOCX. Компонент создает документы DOCX в соответствии с Office Open XML (Ecma 4-е издание). Компонент имеет собственный DOCX рендер.
  • RTF. Компонент создает документы в формате RTF 1.8. Компонент имеет собственный RTF-рендеринг.
  • TXT. Компонент также может создавать текст из HTML. Здесь нет ничего особенного, только одно: символы юникода тоже поддерживаются.

Преимущества компонента

  • Поддержка любых языков: русского, английского, японского, китайского и других.
  • Полученные RTF-файлы полностью сохраняют:
    • структуру содержимого HTML
    • отображение текста
    • шрифт, цвет, стиль текста
    • таблицы
    • изображения в форматах GIF, JPEG, BMP, PNG