Обзор SautinSoft.PdfFocus


Вступление

SautinSoft.PdfFocus это кроссплатформенная .NET-библиотека, которая позволяет Вашим приложениям конвертировать PDF документы во всё: DOCX, RTF, HTML, XML, Excel, изображения и текстовые документы с большим количеством опций и функций:

  • Конвертируйте PDF-документа в виде файла, URL, потока памяти, массива байтов
  • Установите пользовательские страницы и диапазоны для конвертирования «1-3, 5, 8-13, 16»
  • Конвертируйте PDF файл защищенный паролем, если Вы знаете пароль
  • Узнайте количество страниц в PDF и их размеры
  • Выявить таблицы в PDF-документе
  • Растрируйте векторную графику или пропускайте ее
  • Сохраняйте изображения или пропускайте их
  • Показать невидимый текст или нет
  • Добавьте текст об авторских правах на каждую страницу документа
  • Используйте интерфейс оптического распознавания символов (OCR)
  • Поддерживает кодеки JBIG2 и JPEG2000

SautinSoft.PdfFocus поддерживает конвертирование всех типов и форматов PDF-документов: PDF 1.0-1.7, PDF/A.

Если вам нужен компонент для загрузки, создания нового, поиска и замены, изменения и сохранения в PDF-документы: взгляните на наш SautinSoft.Document — он может все!

Направления конвертирования

  • Конвертирование PDF в DOCX, RTF:
    • Три режима конвертирования:
      • Плавный - весь текст упорядочен по абзацам, выглядит так, как будто набран человеком
      • Точный – весь текст упорядочен с использованием блоков небольшой формы (x,y), как в структуре PDF
      • Непрерывный - весь текст упорядочен с помощью блоков большой формы с координатами (x,y)
    • Воссоздает настоящие таблицы со строками и ячейками из графических линий
    • Созданный документ DOCX полностью совместим со спецификацией Office Open XML, ECMA-376
    • Созданный документ в формате RTF полностью совместим со спецификацией RTF 1.8
    • Полное форматирование текста с помощью изображений, цветов, фона, фигур, таблиц, векторной графики, стилей шрифтов, размеров
    • Сохраняйте масштабирование и расстояние между символами или установите унифицированные
    • Полная поддержка Юникода.

  • Конвертирование PDF в текст:
    • Производимые текстовые документы с полной поддержкой Unicode
    • Макет документа в текстовом режиме аналогичен оригинальному PDF

  • Конвертирование PDF в изображения:
    • TIFF, Многостраничный-TIFF, Многостраничный-TIFF-CCITT4
    • JPG, Jpeg
    • PNG
    • Bitmap
    • System.Drawing.Image
    • Возможность установки DPI, глубины цвета, формата изображения
    • Возможность установить пользовательскую ширину и высоту в пикселях, пунктах или процентах

  • Конвертирование PDF в HTML:
    • HTML5 с CSS
    • Два режима конвертирования:
      • HTML-Фиксированный - весь текст упорядочен с использованием блоков небольшой формы (x, y)
      • HTML-Плавный - весь текст упорядочен по абзацам, выглядит так, как будто набран человеком
    • Укажите название документа
    • Храните изображения внутри HTML-документа в виде двоичных данных либо в виде отдельных файлов PNG или JPG
    • Установите качество для всех изображений в HTML-документе

  • Конвертирование PDF в Excel:
    • Создает книги .xls
    • Позволяет поместить все страницы из PDF-документа в один лист или создать отдельные листы для каждой страницы PDF
    • Два режима конвертирования:
      • Конвертируйте все текстовые данные
      • Конвертирование только табличных данных

  • Конвертирование PDF в XML:
    • Создает правильно сформированные XML-документы
    • Два режима конвертирования:
      • Конвертируйте все текстовые данные
      • Конвертирование только табличных данных

  • Извлечение изображений из PDF:
    • Извлечение всех изображений и векторной графики
    • Извлечение изображения с определенных страниц
    • Извлечение только изображения с определенной шириной или высотой