История версий - SautinSoft.PdfFocus


2024.3.28 - 28 Марта, 2024

Мы рады предложить Вам новую версию «SautinSoft.PdfFocus 2024.3» Давайте посмотрим, что нового:

  • Распознавание шрифта:
    Была проделана большая работа по оптимизации процесса распознавания шрифтов из PDF.
    Иногда возникала ситуация, когда шрифт был в системе (установлен), но его полужирный, обычный, курсивный шрифт не совпадал или не был зарегистрирован.
    Теперь Ваши шрифты будут читаться с большей точностью.

    Font recognition:

  • PDF Reader:
    Исправлена ошибка с преобразованием PDF в изображения. Проблема заключалась в некорректной обработке некоторых конкретных изображений, записанных в несколько слоев.
  • Исправлены мелкие неполадки, найденные и отправленные нам нашими клиентами. Таким образом, компонент стал более безошибочным.

2024.2.5 - 5 февраля, 2024

Мы провели полный и подробный анализ, тестирование нашей библиотеки SautinSoft.PdfFocus в сравнении с ведущими мировыми лидерами в нашей области. После анализа команде разработчиков была поставлена задача улучшить работу в двух ключевых моментах:

1. Увеличить скорость загрузки и сохранения PDF и DOCX документов
2. Уменьшить размер результирующих PDF и DOCX документов

Наши разработчики успешно справились с задачами!

Мы рады сообщить, что на данный момент новая версия SautinSoft.PdfFocus 2024.2.5 занимает с 1-го по 3-е место в мире лидеров .NET библиотек по скорости загрузки документов в формате PDF и сохранения в формате DOCX.

Мы также подготовили несколько критических исправлений и улучшений:

  • Поднабор шрифтов:
    Поднабор — это практика создания “подмножества” шрифта - файла, содержащего пользовательскую (и обычно ограниченную) коллекцию глифов. Мы проделали большую работу по улучшению поднабора шрифтов.

    Subsetting Fonts

  • Word Writer:
    Ранее файл, состоящий из пары слов, мог занимать несколько мегабайт из-за наличия встроенных шрифтов. Мы оптимизировали и уменьшили размер встроенных шрифтов без потери качества.

    Word Writer/Reader

  • Качество изображений:
    Исправлено преобразование изображений в формат jpeg, уменьшен размер выходного файла.
  • Скорость обработки изображений:
    Мы увеличили скорость работы с изображениями за счет оптимизации SkiaSharp-engine.

    Images

    • Главная новость заключается в том, что мы перешли на новый графический движок - SkiaSharp (вместо System.Drawing.Common):
      SkiaSharp — это кроссплатформенный API 2D-графики для платформ .NET, основанный на графической библиотеке Google Skia (skia.org).
      Он предоставляет комплексный 2D API, который можно использовать в моделях мобильных, серверных и настольных компьютеров для рендеринга изображений.
      SkiaSharp предоставляет кроссплатформенные привязки для:
      • .NET Standard 1.3
      • .NET Core
      • .NET 6
      • Tizen
      • Android
      • iOS
      • tvOS
      • macOS
      • Mac Catalyst
      • WinUI 3 (Windows App SDK / Uno Platform)
      • Windows Classic Desktop (Windows.Forms / WPF)
      • Web Assembly (WASM)
      • Uno Platform (iOS / macOS / Android / WebAssembly)
  • Новые зависимости:
    <PackageReference Include="Svg.Skia" Version="1.0.0.3" />
    <PackageReference Include="System.IO.Packaging" Version="4.4.0" />
    <PackageReference Include="System.Text.Encoding.CodePages" Version="4.5.0" />
    <PackageReference Include="System.Xml.XPath.XmlDocument" Version="4.3.0" />
    <PackageReference Include="System.Drawing.Common" Version="4.7.3" />
    <PackageReference Include="Microsoft.IO.RecyclableMemoryStream" Version="2.3.2" />
    <PackageReference Include="System.Security.Cryptography.Pkcs" Version="7.0.3" />
    <PackageReference Include="System.Configuration.ConfigurationManager" Version="4.7.0" />
    <PackageReference Include="SkiaSharp" Version="2.88.6" />
  • DOCX/RTF Writer: Исправлена ошибка чтения маркера списка.
  • HTML Writer:
    Исправлена ошибка с закрывающим тегом </li>. Ранее возникали ситуации, когда теги <li>...</li> не всегда работали корректно. Добавлена обработка специальных символов "&fraq12;" и других для европейских языков.
  • Добавлен XLSX формат для выходных файлов.

    PDF to XLSX

  • Поддержка .NET 8.0: Начиная с версии 2024.2 появились сборки SautinSoft.PdfFocus.dll, скомпилированные для единой платформы .NET 8.0.
  • Исправлены мелкие проблемы, найденные и отправленные нам от наших клиентов. Поэтому компонент стал более безошибочным.

2023.5.10 – 10 мая 2023 г.
Мы рады предложить Вам новую версию SautinSoft.PdfFocus 2023.5!
Начиная с этой версии, нумерация сборок будет начинаться с «Год/Месяц/День». Вы всегда можете отслеживать новые выпуски и получать последние версии.
Посмотрим, что нового:

  • Мы добавили возможность использовать альтернативный шрифт, загружаемый из GDIFont.
  • Исправлена ошибка, из-за которой результат конвертирования "PDF в XML" был пустым (не сбой).
  • Улучшена работа со шрифтами: теперь поиск подходящего шрифта осуществляется по нескольким параметрам и дает лучшее соответствие.
  • HTML Reader: Добавлена поддержка нескольких тегов и добавлена возможность распознавания языка (En, Ch, Sl и так далее) текста содержимого.
  • RTF Reader:
    • CheckBoxes считываются правильно. Исправлена ошибка при чтении значения: true/false.
    • Исправлена ошибка, из-за которой отсутствовала граница таблицы.
  • PDF Writer: Исправлена ошибка с чтением изображений, расположенных по локальному пути: "<img src="file://с:/logo.png">
  • Исправлены незначительные проблемы, найденные и отправленные нам нашими клиентами. Таким образом, компонент стал более безошибочным.

8.6.1.18 – 18 января 2023 г.
Мы рады предложить Вам новую версию SautinSoft.PdfFocus 8.6! Давайте посмотрим детали:

  • Гиперссылки исчезли при использовании опции: "WordOptions.DetectTables = true;". Проблема решена.
  • Проблема со сглаживанием таблицы в одну строку решена.
  • В этом релизе исправлены ошибки чтения и записи римских цифр и нумерованных списков.
  • PDF Reader:
    • Исправлена проблема, из-за которой текст в таблице исчезал, если таблица занимала несколько страниц.
    • Вертикальный текст в ячейке. Текст исчез после конвертирования. Проблема решена.
  • Исправлены незначительные проблемы, найденные и отправленные нам нашими клиентами. Таким образом, компонент стал более безошибочным.

8.5.10.20 – 20 октября 2022 г.
Мы рады предложить Вам новую версию SautinSoft.PdfFocus 8.5! Давайте посмотрим детали:

  • Поддержка .NET 7.0: Начиная с версии 8.5 появились сборки SautinSoft.PdfFocus.dll, скомпилированные для единой платформы .NET 7.0.

    Начиная с версии 8.5 появились сборки SautinSoft.PdfFocus.dll, скомпилированные для единой платформы .NET 7.0

  • PDF Reader:
    Исправлена ошибка, из-за которой текст в таблице исчезал, если таблица занимала несколько страниц.
    Вертикальный текст в ячейке. Текст пропадал после конвертации. Проблема решена.
  • RTF, DOCX:
    Улучшен алгоритм расчета размера заполнения для абзацев.
    Улучшена работа с документами DOCX и RTF, а также исправлены некоторые мелкие проблемы, о которых нам сообщали наши клиенты.

8.4.5.25 – 25 мая 2022 г.
Незначительное обновление! Давайте посмотрим детали:

  • Office Edition: исправлена проблема с ключами serail для «конвертирования PDF в XML».

8.4.5.18 – 18 мая 2022 г.
Рады сообщить о выходе новой версии SautinSoft.PdfFocus 8.4! Посмотрим на улучшения:

  • PDF в XML: Мы улучшили механизм определения табличных данных: ячеек и столбцов.
  • Исправлены некоторые ошибки, присланные нашими клиентами, благодаря чему компонент стал более безошибочным.

8.3.3.25 – 25 марта 2022 г.
Рады сообщить о выходе новой версии SautinSoft.PdfFocus 8.3! Посмотрим на улучшения:

  • PDF в XLS: Улучшен алгоритм для создания XLS-книг из PDF-документов, а именно определение фона ячейки и поиск объединенных ячеек.
  • HTML Edition объединена с Office Edition. Текущие пользователи обоих выпусков теперь могут конвертировать PDF в следующие форматы: DOCX, RTF, HTML, XLS, XML и текст.

8.2.1.18 – 18 января 2022 г.
Рады сообщить о выходе новой версии SautinSoft.PdfFocus 8.2! Давайте посмотрим на детали:

  • Поддержка .NET 6.0: Начиная с версии 8.5 появились сборки SautinSoft.PdfFocus.dll, скомпилированные для единой платформы .NET 6.0.

    Начиная с версии 8.2 появились сборки SautinSoft.PdfFocus.dll, скомпилированные для единой платформы .NET 6.0

  • Исправлена проблема с межстрочным интервалом при чтении PDF-документов.
  • Исправлена проблема с шириной текстовой формы при конвертировании PDF в Word в режимах Exact и Continuous рендеринга.
  • Исправлена проблема со свойствами RenderPages и RenderPagesString.
  • PDF в XLS: Улучшен алгоритм создания объединенных ячеек.
  • Исправлены незначительные проблемы, найденные и отправленные нам нашими клиентами. Таким образом, компонент стал более безошибочным.

8.0.6.21 – 21 июня 2021 г.
Рады сообщить о выходе новой версии SautinSoft.PdfFocus 8.0! Давайте посмотрим, что нового:

  • PDF в Изображения: Мы интегрировали новый механизм конвертирования PDF в изображения, унифицированный с нашим основным компонентом SautinSoft.Document. Это нововведение повысило надежность и качество конвертирования.
  • PDF в DOCX, RTF, HTML: Добавлена полная поддержка TOC (Оглавление), включая чтение его из PDF и воссоздание в выходных документах.
  • PDF в DOCX:
    • Добавлена возможность загружать встроенные шрифты таким образом, чтобы их можно было вставлять в сохраненные документы DOCX.
    • Улучшен расчет межстрочного интервала для текста. Это влияет на точность расположения текста в обрабатываемом документе.
    • Улучшен алгоритм обрезки, который положительно влияет на качество изображения при загрузке PDF-документов.
    • Свойство PreserveEmbeddedFonts получило режим "Авто". Теперь вы можете установить его в три состояния: Включено, отключено и автоматически.
  • Мы удалили зависимости от библиотек DLL PresentationCore и Presentationframework.

7.8.1.29 – 29 января 2021 г.
Мы рады предложить вам новую версию SautinSoft.PdfFocus 7.8! Давайте посмотрим, что нового:

  • Абсолютно новая возможность OCR - выполнять распознавание текста при конвертировании PDF в DOCX, HTML, RTF и текст. Начиная с версии 7.8 компонент предоставляет API для подключения любого компонента OCR для конвертирования отсканированных PDF-документов в редактируемые.

    OCR

    Здесь мы подготовили для вас примеры кода с использованием различных бесплатных библиотек распознавания:
  • Поддержка .NET 5.0: Начиная с версии 7.8 появилась SautinSoft.PdfFocus.dll сборка, скомпилированная для унифицированной платформы .NET 5.0.

    SautinSoft.PdfFocus. dll сборка, скомпилированная  для единой платформы .NET 5.0

  • DOCX Writer: Добавлена "таблица шрифтов" внутри созданных документов DOCX. Экземпляр части этого типа содержит информацию о каждом шрифте, используемом в содержимом документа. Когда потребитель читает документ WordprocessingML, он должен использовать эту информацию, чтобы определить, какие шрифты использовать для отображения документа. когда указанные шрифты недоступны в системе потребителя.
  • Исправлена ошибка с загрузкой определенных изображений из PDF. Это изображения, упакованные с использованием декодера JBIG2, и в то же время их глобальные данные были сжаты другим декодером FlateDecode.
  • Исправлена хитрая ошибка в алгоритме "Clipper". В случае, если PDF-документ содержал изображения с контуром обрезки, этот алгоритм снижал качество изображения в окончательных документах (DOCX, RTF, HTML). Теперь качество выходного изображения такое же, как и во входном PDF.

7.7.7.24 – 24 июля 2020 г.
Рады сообщить о выходе новой версии SautinSoft.PdfFocus 7.7! Давайте посмотрим, что нового:

  • Добавлена автоматическая возможность сохранения изображений в исходном формате, как они были сохранены во входном PDF. Например, при конвертировании PDF в DOCX все встроенные изображения, которые являются JPEG, также будут встроены в результирующий DOCX как Jpeg-изображения, другие как PNG. Предыдущие версии сохраняли все изображения только в формате PNG.
    Чтобы обеспечить эту функцию, мы добавили новые свойства EmbeddedImagesFormat и EmbeddedJpegQuality.
    Таким образом, это новшество снижает вес результирующих документов DOCX, HTML и RTF, содержащих изображения до 6 раз.
  • Улучшен алгоритм считывания barcode шрифтов из PDF-документов.
  • PDF в HTML: Добавлен кэш изображений, чтобы избежать многократного дублирования одних и тех же изображений при сохранении в HTML.
  • PDF в HTML: Улучшен алгоритм рендеринга HTML-документа в Fixed режиме. Теперь отдельные символы со своими координатами (x,y) объединяются в отдельные слова, а затем в отдельные предложения. Таким образом, данное нововведение позволило уменьшить размер HTML-документа в 3 раза.


Если вам нужен пример кода или у вас есть вопрос: напишите нам по адресу [email protected] или спросите в онлайн-чате (правый нижний угол этой страницы) или используйте форму ниже:



Вопросы и предложения всегда приветствуются!

Мы разрабатываем компоненты .Net с 2002 года. Мы знаем форматы PDF, DOCX, RTF, HTML, XLSX и Images. Если вам нужна помощь в создании, изменении или преобразовании документов в различных форматах, мы можем вам помочь. Мы напишем для вас любой пример кода абсолютно бесплатно.