История версий - SautinSoft.Document


2024.1.24 - 24 января, 2024
Мы провели полный и подробный анализ, тестирование нашей библиотеки SautinSoft.Document в сравнении ведущими мировыми лидерами в нашей области. После анализа команде разработчиков была поставлена задача улучшить работу в двух ключевых моментах:

1. Увеличить скорость загрузки и сохранения PDF и DOCX документов
2. Уменьшить размер результирующих PDF и DOCX документов

Наши разработчики успешно справились с задачами!

С радостью сообщаем, что на данный момент новая версия SautinSoft.Document 2024.1.24 занимает в мире основных лидеров .NET библиотек рынка от 1-го до 3-го места по скорости Загрузки/Сохранения документов в форматах PDF и DOCX.

Мы также подготовили несколько критических исправлений и улучшений:

  • Поднабор шрифтов:
    Поднабор — это практика создания “подмножества” шрифта - файла, содержащего пользовательскую (и обычно ограниченную) коллекцию глифов. Мы проделали большую работу по улучшению поднабора шрифтов.

    Subsetting Fonts

  • Word Writer/Reader:
    Ранее файл, состоящий из пары слов, мог занимать несколько мегабайт из-за наличия встроенных шрифтов. Мы оптимизировали и уменьшили размер встроенных шрифтов без потери качества.

    Word Writer/Reader

  • Качество изображений:
    Исправлено преобразование изображений в формат Jpeg, уменьшен размер выходного файла.
  • Скорость обработки изображений:
    Мы увеличили скорость работы с изображениями за счет оптимизации SkiaSharp-engine.

    Images


  • Исправлены мелкие проблемы, найденные и отправленные нам от наших клиентов. Компонент стал более безошибочным.

2024.1.9 - 9 января, 2024

Мы рады объявить об официальном выпуске нашего нового SautinSoft.Document 2024.1!
Мы подготовили множество исправлений и улучшений. Давайте посмотрим, что нового:

  • Главная новость заключается в том, что мы перешли на новый графический движок - SkiaSharp (вместо System.Drawing.Common):
    SkiaSharp — это кроссплатформенный API 2D-графики для платформ .NET, основанный на графической библиотеке Google Skia (skia.org).
    Он предоставляет комплексный 2D API, который можно использовать в моделях мобильных, серверных и настольных компьютеров для рендеринга изображений.
    SkiaSharp предоставляет кроссплатформенные привязки для:
    • .NET Standard 1.3
    • .NET Core
    • .NET 6
    • Tizen
    • Android
    • iOS
    • tvOS
    • macOS
    • Mac Catalyst
    • WinUI 3 (Windows App SDK / Uno Platform)
    • Windows Classic Desktop (Windows.Forms / WPF)
    • Web Assembly (WASM)
    • Uno Platform (iOS / macOS / Android / WebAssembly)
  • Новые зависимости:
    <PackageReference Include="SkiaSharp" Version="2.88.6" />
    <PackageReference Include="Svg.Skia" Version="1.0.0.3" />
    <PackageReference Include="SautinSoft.Document" Version="*" />
    <PackageReference Include="System.IO.Packaging" Version="4.4.0" />
    <PackageReference Include="System.Text.Encoding.CodePages" Version="4.5.0" />
    <PackageReference Include="System.Xml.XPath.XmlDocument" Version="4.3.0" />
  • HTML Reader:
    Добавлено чтение данных SVG, а также форм и полей HTML.
  • DOCX/RTF Writer: Исправлена ошибка чтения маркера списка.
  • Исправлены мелкие проблемы, найденные и отправленные нам от наших клиентов. Поэтому компонент стал более безошибочным.

2023.9.10 - 10 сентября 2023 г.
Мы очень рады объявить об официальном выпуске нашего нового SautinSoft.Document 2023.9!
Мы подготовили множество исправлений и улучшений. Давайте посмотрим, что нового:

  • DocumentCore: MailMerge - исправлена ошибка с ошибочным определением CharacterFormat (font, size, color).
  • HTML Writer:
    Исправлена ошибка с закрывающим тегом </li>. Ранее возникали ситуации, когда теги <li>...</li> не всегда работали корректно.
    Добавлена обработка специальных символов "&fraq12;" и других для европейских языков.
  • RTF Writer:
    Дизайн границ таблицы был нарушен во время конвертирования. Исправлено.
    Исправлено некорректное действие "h.PageStyle.PageHeader.MarginBottom".
  • RTF Reader:
    Исправлена ошибка с чтением маркера списка.
  • DOCX Writer:
    Добавлено новое свойство h.TableAutoFit = true, когда оно включено, ширина столбцов в таблице изменяется в зависимости от количества текста в них (чем больше текста, тем больше столбец). По умолчанию: отключено.
    После конвертирования возникла проблема со стилем макета. Частично исправлено.
  • PDF Writer:
    Некоторые буквы и знаки препинания отсутствуют после конвертирования. Мы внесли изменения и улучшили наш алгоритм.
    Исправлена проблема с выравниванием текста при преобразовании DOCX в PDF.
    В некоторых случаях текст растягивался на несколько страниц. Произведена оптимизация.
  • Поддержка .NET 8.0: Начиная с версии 2023.9 появились сборки SautinSoft.Document.dll, скомпилированные для единой платформы .NET 8.0.
  • Исправлены мелкие проблемы, найденные и отправленные нам от наших клиентов. Поэтому компонент стал более безошибочным.

2023.4.19 – 19 апреля 2023 г.
Мы очень рады объявить об официальном выпуске нашего нового SautinSoft.Document 2023.4!
Начиная с этой версии, нумерация сборок будет начинаться с «Год/Месяц/День». Вы всегда можете отслеживать новые выпуски и получать последние версии.

Посмотрим, что нового:

  • Мы добавили возможность использовать альтернативный шрифт, загружаемый из GDIFont.
  • Исправлена ошибка, из-за которой результат конвертирования "PDF в XML" был пустым (не сбой).
  • Улучшена работа со шрифтами: теперь поиск подходящего шрифта осуществляется по нескольким параметрам и дает лучшее соответствие.
  • HTML Reader: Добавлена поддержка нескольких тегов и добавлена возможность распознавания языка (En, Ch, Sl и так далее) текста содержимого.
  • RTF Reader:
    • CheckBoxes считываются правильно. Исправлена ошибка при чтении значения: true/false.
    • Исправлена ошибка, из-за которой отсутствовала граница таблицы.
  • PDF Writer: Исправлена ошибка с чтением изображений, расположенных по локальному пути: "<img src="file://с:/logo.png">
  • Исправлены незначительные проблемы, найденные и отправленные нам нашими клиентами. Таким образом, компонент стал более безошибочным.

5.8.1.26 – 26 января 2023 г.
Мы очень рады объявить об официальном выпуске нашего нового SautinSoft.Document 5.8! Посмотрим, что нового:

  • HTML Writer:
    Улучшен алгоритм рендеринга HTML-документа в режиме Fixed/Flowing. Мы исправили проблему с «маркированным списком» и добавили поддержку следующих тегов: {\pntext 1.\tab}, {\pntext 2.\tab}.
  • PDF Writer:
    Улучшен алгоритм рендеринга изображений.
  • Word Reader:
    Добавлена поддержка функции WORDVARIABLE. Теперь такие документы DOCX, RTF могут быть полностью загружены, изменены и сохранены SautinSoft.Document в поддерживаемых форматах.
  • Добавлены новые примеры кода от наших клиентов: Как вставить содержимое файла в верхний и нижний колонтитулы существующего HTML и другие.
  • Исправлены незначительные проблемы, найденные и отправленные нам нашими клиентами. Таким образом, компонент стал более безошибочным.

5.7.11.28 – 28 ноября 2022 г.
Мы очень рады объявить об официальном выпуске нашего нового SautinSoft.Document 5.7! Давайте посмотрим, что нового:

  • Алгоритм SautinSoft.Document был улучшен:
    Решена проблема с неполным удалением комментариев. Теперь "document.Comments.Clear();" работает исправно.
    Проблема со сглаживанием таблицы в одну строку решена.
    Гиперссылки пропадали при использовании опции: "WordOptions.DetectTables = true;". Проблема решена.
    Поддержка .NET 7.0: Начиная с версии 5.7 появились сборки SautinSoft.Document.dll, скомпилированные для единой платформы .NET 7.0.

    Начиная с версии 5.7 « ;SautinSoft.Document» появились сборки SautinSoft.Document.dll, скомпилированные для единой платформы .NET 7.0

    В этом выпуске исправлены ошибки чтения и записи римских цифр и нумерованных списков.
    Исправлена проблема с прозрачным цветом фона внутри столбцов таблицы.
  • PDF Reader:
    Исправлена ошибка, из-за которой текст в таблице исчезал, если таблица занимала несколько страниц.
    Вертикальный текст в ячейке. Текст пропадал после конвертации. Проблема решена.
  • RTF, DOCX:
    Улучшен алгоритм расчета размера заполнения для абзацев.
    Улучшена работа с документами DOCX и RTF, а также исправлены некоторые мелкие проблемы, о которых нам сообщали наши клиенты.
    Решена проблема с ошибочным определением исходной кодировки. Теперь кодировки (Latin1, UTF-8, ISO-XXX, ASCII и т. д.) распознаются правильно.
    Исправлена ошибка с переносом таблиц. Исправлена ошибка при проверке "номер части".
    Устранена проблема с некорректным определением межстрочного интервала.
  • PDF Writer:
    Исправлена ошибка, из-за которой текст в таблице исчезал, если таблица занимала несколько страниц.
    Вертикальный текст в ячейке. Текст пропал после конвертации. Проблема решена.
    Улучшен алгоритм расчета размера заполнения для абзацев.
    Улучшена работа с документами DOCX и RTF и исправлены некоторые мелкие проблемы, о которых нам сообщали наши клиенты.
  • HTML:
    Исправлена ошибка чтения символа '\n'. Теперь обработка текста с этим символом корректна.
    Исправлена ошибка с некорректным чтением исходной кодировки HTML и добавлена новая опция "SautinSoft.Document.eEncoding.windows1252;".
    Исправлены мелкие проблемы, найденные и отправленные нам от наших клиентов. Поэтому компонент стал более безошибочным.

5.6.8.16 – 16 августа 2022 г.
Рады сообщить о выходе новой версии SautinSoft.Document 5.6! Посмотрим на улучшения:

  • Исправлена ошибка с неверным определением ширины символов. Теперь текст после конвертирования в любом направлении (DOCX, RTF, HTML, PDF) более реалистичен.
  • Мы исправили некоторые проблемы с плавающими таблицами, параметром TextColor и случайными зависаниями.
  • RTF reader: исправлена ошибка, добавлена поддержка линейного цвета (\clcfpatN) для затемнения (\clshdng), и теперь два цвета фона и линейного смешиваются в зависимости от необходимого процента.
  • HTML reader: исправлена ошибка при чтении символа '\n'. Теперь обработка текста с этим символом корректна.
  • DOCX reader: улучшен алгоритм расчета размера фона для абзацев.
  • DOCX writer: исправлена ошибка при проверке "номер части".
  • RTF writer: устранена ошибка с переносом таблиц.
  • PDF writer: проблема с «System.NullReferenceException — ссылка на объект не задана» устранена. В движок внесены изменения и улучшения.

5.5.4.14 – 14 апреля 2022 г.
Рады сообщить о выходе новой версии SautinSoft.Document 5.5.4! Посмотрим на улучшения:

  • DOCX, RTF в PDF:
    • Мы улучшили отображение символов в PDF на следующих языках: корейский, японский, китайский, деванагари, монгольский, огамский, рунический, тамильский, тайский, тибетский, слоговое письмо канадских аборигенов, шрифт Брайля, бенгальский, бирманский, чероки, гуджарати, грузинский, готический и эфиопский языки.
    • Исправлена проблема с параметром автоподбора при обработке таблицы. Теперь он работает более стабильно.
    • Устранена проблема с чтением полей формы. Теперь чтение полей работает корректно и полноценно.
    • Улучшен алгоритм для более точного определения межстрочного интервала!
    • Исправлена ошибка с "черным фоном". При использовании разных стилей иногда инвертировался фон и текст не читался.
    • Исправлена редкая проблема с обработкой границ абзаца.
    • Исправлена проблема с водяным знаком. На некоторых Word-файлах, содержащих старую VML-графику, была ошибка с прозрачностью водяного знака.
  • PDF Reader:
    • Устранена проблема "System.OutOfMemoryException". Улучшена работа компонента с оперативной памятью в потоках.
  • Устранена проблема с неверным каталогом шрифтов для MacOS.

5.4.12.1 – 1 декабря 2021 г.
Мы очень рады объявить об официальном выпуске нашего нового SautinSoft.Document 5.4! Давайте посмотрим, что нового:

  • DOCX Reader:
    • Мы добавили поддержку чтения файлов DOCX с вложенными объектами DOCX внутри.
    • Устранена проблема с чтением прозрачных изображений.
  • HTML Reader:
    • Исправлена проблема с чтением правил css "margin-left:" и "margin-right:" в некоторых редких случаях.
    • Исправлена проблема со свертыванием пробелов при чтении некоторых документов.
  • RTF Reader:
    • Добавлена поддержка загрузки документов, содержащих символы CJK (китайский, японский и корейский).
  • PDF Writer:
    • Исправлена ошибка с автоподбором и выравниванием ячеек (заполнением) границ таблицы.
    • Параметр firstRow.RowFormat.RepeatOnEachPage хорошо работает и в PDF.
  • RTF в PDF:

    • Исправлена проблема с верхним/нижним колонтитулом. Была ошибка, из-за которой верхние/нижние колонтитулы скрывались за комментарием. Добавлена поддержка этого тега: "pnseclvl".
  • Добавлена поддержка формата DOC (MS Word 97-2003) для загрузки. Звучит смешно, но мы действительно добавили эту функцию в 2021 году 😀. Теперь SautinSoft.Document также может загружать любые документы DOC без каких-либо зависимостей. Функция работает в .NET Framework 4.5 и выше, включая .NET Core и так далее.
  • Улучшена работа с документами DOCX и RTF и исправлены некоторые мелкие проблемы, о которых нам сообщали наши клиенты.

5.3.6.22 – 22 июня 2021 г.
Рады сообщить о выходе новой версии SautinSoft.Document 5.3! Посмотрим на улучшения:

  • Добавлена поддержка комментариев (комментарии описывают аннотации, которые привязаны к области содержимого документа, но содержат произвольный объем содержимого на уровне блоков, хранящегося в отдельных историях документа).
  • Добавлены все стандартные шаблоны для создания списков, такие как ромбы, стрелки, галочки, буквы со скобками и точками и так далее. Предыдущая версия не поддерживала редкие шаблоны списков.
  • PDF reader:
    • Добавлена возможность загружать встроенные шрифты таким образом, чтобы их можно было вставлять в сохраненные документы PDF и DOCX.
    • Добавлена полная поддержка TOC (оглавления), включая чтение из PDF и воссоздание в выходных документах.
    • Улучшен расчет межстрочного интервала для текста. Это влияет на точность расположения текста в обрабатываемом документе.
    • Улучшен алгоритм обрезки, что положительно влияет на качество изображения при загрузке PDF-документов.
    • Свойство PreserveEmbeddedFonts, расположенное в PdfLoadOptions имеет автоматический режим. Теперь вы можете установить его в три состояния: включено, отключено и автоматически.
  • HTML reader:
    • Добавлена поддержка списков определений HTML: <dl>, <dt>, <dd>.
    • Добавлены новые свойства DeviceCategory, DeviceWidth и DeviceHeight в HtmlLoadOptions.
    • Расширенная поддержка CSS для <div> элемент, включая режим отображения Flex.
    • Улучшенный синтаксический анализ сложных таблиц с атрибутами colspan и rowspan.
    • Исправлена проблема, когда вложенная таблица не перемещалась на следующую страницу.
    • Устранена проблема с неправильным цветовым форматированием сложных гиперссылок.
  • DOCX reader:
    • Добавлена возможность загружать документы DOCX со встроенными шрифтами.
    • Устранена проблема с загрузкой изменений в верхнем или нижнем колонтитуле из документов RTF и DOCX.
  • DOCX writer:
    • Добавлена возможность сохранять документы DOCX со встроенными шрифтами.
  • RTF writer:
    • Исправлена проблема с позиционированием фигур со встроенным макетом.
  • HTML writer:
    • Добавлена поддержка рендеринга TOC (оглавления).
  • PDF writer:
    • Добавлено новое свойство AllowFontSubsetting для управления тем, как вставлять шрифты (полностью или частично) в выходной PDF.

5.2.2.16 - 16 февраля 2021 года
Мы очень рады объявить об официальном выпуске нашего нового SautinSoft".Document 5.2! Давайте посмотрим, что нового:

  • Абсолютно новая возможность OCR - выполнять Оптическое распознавание символов во время загрузки и конвертирования PDF и графических документов. Начиная с версии 5.2 "SautinSoft.Document" предоставляет Ваш API для подключения любого компонента распознавания текста для конвертирования отсканированных PDF-документов для редактирования.

    Начиная с версии 5.2 «SautinSoft.Document» ; дает ваш API для подключения любого компонента OCR для конвертирования отсканированных PDF-документов в редактируемые.

    Здесь мы подготовили для вас примеры кода с использованием различных бесплатных библиотек распознавания:
  • Абсолютно новый HTML-parser and CSS-parser. Начиная с версии 5.2 компонент имеет новые HTML и CSS парсеры.

    Абсолютно новый HTML-парсер и CSS-парсер

    Эта реализация дает следующие преимущества:

    1. Создан для расширенной поддержки HTML5.
    2. Сделано в соответствии с официальной спецификацией W3C.
    3. Чтение незакрытых, поврежденных и недопустимых HTML-элементов.
    4. Мощные возможности для чтения CSS с учетом сложного наследования и производных элементов.
    5. Стандарт .NET 1.3 и выше.
    Мы надеемся, что новые парсеры сделают «SautinSoft.Document» компонент надежным и идущий в ногу со временем.
  • Добавлена поддержка Content Controls - элементов управления содержимым, пользовательских xml-частей и привязки данных. Для получения дополнительной информации смотрите: https://docs.microsoft.com/en- us/visualstudio/vsto/content-controls и https://docs.microsoft.com/en-us/visualstudio/vsto/custom-xml-parts-overview. Кроме того, мы подготовили интересные примеры использования элементов управления контентом:
  • Поддержка .NET 5.0: Начиная с версии 5.2 появилась SautinSoft.Document.dll сборка, скомпилированная для унифицированной платформы .NET 5.0.

    SautinSoft.Document. dll сборка, скомпилированная  для единой платформы .NET 5.0

  • DOCX Writer: Добавлена "таблица шрифтов" внутри созданных документов DOCX. Экземпляр части этого типа содержит информацию о каждом шрифте, используемом в содержимом документа. Когда потребитель читает документ WordprocessingML, он должен использовать эту информацию, чтобы определить, какие шрифты использовать для отображения документа. когда указанные шрифты недоступны в системе потребителя.
  • Добавлена поддержка загрузки документов с URL в метод Load().
  • Исправлена ошибка с загрузкой определенных изображений из PDF. Это изображения, упакованные с использованием декодера JBIG2, и в то же время их глобальные данные были сжаты другим декодером FlateDecode.
  • Исправлена хитрая ошибка в алгоритме "Clipper". В случае, если PDF-документ содержал изображения с контуром обрезки, этот алгоритм снижал качество изображения в окончательных документах (DOCX, RTF, HTML). Теперь качество выходного изображения такое же, как и во входном PDF.

5.0.10.23 – 23 октября 2020 г.
Мы рады сообщить о выходе новой версии SautinSoft.Document 5.0! Давайте посмотрим на улучшения:

  • DocumentBuilder. Это мощный класс, упрощающий работу с кодом и позволяющий динамическое построение документа с нуля или добавление новых элементов в существующий документ. Смотрите пример расширенного кода: Создайте документ с помощью DocumentBuilder.
  • PDF/A. Добавлена возможность сохранять PDF/A в соответствии с уровнем соответствия. Подробнее здесь.
  • Revisions and Track changes - исправления и отслеживание изменений. Функция «Track Changes» в Microsoft Word позволяет отслеживать изменения к содержанию и форматированию, сделанному пользователями. При включении этой функции все вставленные, удаленные и измененные элементы документа будут визуально выделены информацией о том, кто, когда и что было изменено смотрите пример кода.
  • HTML Writer: добавлен кеш изображения, чтобы предотвратить многократное дублирование одного и того же изображения при сохранить его в HTML.
  • PDF Writer: исправлена ошибка с записью метаданных: создатель, автор, тема, ключевые слова и так далее.
  • HTML Writer: улучшен алгоритм рендеринга HTML-документа в фиксированном режиме. Теперь отдельно символы с собственными координатами (x,y) объединяются в отдельные слова, а затем в отдельные предложения. Таким образом, данное нововведение позволило уменьшить размер HTML-документа в 3 раза.
  • Мы улучшили наш PDF-renderer в компоненте SautinSoft.Document, добавив специальный кэш изображений. Данные для повторяющегося изображения не будут помещены в документ PDF дважды. Это нововведение действительно повлияло на PDF размер и скорость рендеринга.
  • Исправлена ошибка рендеринга TOC (оглавления) при сохранении в фиксированных форматах: PDF, HTML-Fixed, Изображение.

4.5.6.17 – 17 июня 2020 г.
Мы рады предложить Вам новый SautinSoft.Document 4.5! Посмотрим, что нового:




Если вам нужен пример кода или у вас есть вопрос: напишите нам по адресу [email protected] или спросите в онлайн-чате (правый нижний угол этой страницы) или используйте форму ниже:



Вопросы и предложения всегда приветствуются!

Мы разрабатываем компоненты .Net с 2002 года. Мы знаем форматы PDF, DOCX, RTF, HTML, XLSX и Images. Если вам нужна помощь в создании, изменении или преобразовании документов в различных форматах, мы можем вам помочь. Мы напишем для вас любой пример кода абсолютно бесплатно.