ПРОДУКТЫСКАЧАТЬ  КУПИТЬ  ПОМОЩЬ БЛОГ   О КОМПАНИИ  
 
Визитная карточка
HTML в RTF
>>HTML в DOCX
HTML в Text
Объединение RTF
Скачать
Купить
Online-demo
Документация
Новости
Примеры кода

Конвертирование HTML в DOCX с помощью C#, VB.NET и других языков .NET.



HTML в DOCX конвертирование с помощью C#, VB.NET, .NET Core.

Введение

Представьте, что через 15 минут после прочтения этого текста, Вы сможете добавить Вашему приложению набор инструментов для преобразования HTML-страниц в формат DOCX с использованием C#, VB.Net или другого языка.NET. Данное решение может использоваться в .NET Core и .NET Framework.

Для начала установите последнюю версию компонента «HTML to RTF .Net» любым способом:

    • Скачайте последнюю версию SDK «HTML to RTF .Net».
    • Перейдите на вкладку "Solution Explorer" и добавьте ссылку на "SautinSoft.HtmlToRtf.dll".
  • Или установите пакет с NuGet.


                      SautinSoft.HtmlToRtf h = new SautinSoft.HtmlToRtf();
            string htmlString = "Hello World!";
            h.OpenHtml(htmlString);
            byte[] docxBytes = h.ToDocx();
            string outputFile = @"c:\Test\result.docx";
            if (docxBytes != null)
            {
                File.WriteAllBytes(outputFile, docxBytes);
                System.Diagnostics.Process.Start(new System.Diagnostics.ProcessStartInfo(outputFile) { UseShellExecute = true });
            }
                    
              

Несмотря на название компонента «HTML to RTF .Net», он может одновременно преобразовывать в формат DOCX, полностью поддерживающий спецификацию Office Open XML. Но мы решили не менять название компонента.

Теперь Вы можете работать с классом HtmlToRtf, который предоставляет Вашему приложению различные методы и свойства для преобразования HTML в DOCX:


API to convert HTML to DOCX in Visual Studio

Используя оба метода OpenHtml() и ToDocx() Вы можете преобразовать HTML-документы в формат DOCX в виде MemoryStream, Files, URI или Bytes Array.



NuGet   Online Demo   Скачать, 8.0.5.12 (Май 12, 2021)



Системные требования

Компонент совместим со всеми языками .NET и поддерживает основные операционные системы.

  • Windows
  • Linux
  • Mac OS

Обратите внимание, что «HTML to RTF .Net» полностью написан на управляемом C#. Это делает его абсолютно автономным и независимым.

.NET Framework 4.0 and higher and .Net Core 2.0 and higher

.NET Framework 4.0, 4.5, 4.6.1 и выше. Старую версию .NET 2.0 можно найти здесь.

.NET Core 2.0 и выше.

Примеры преобразования HTML в DOCX на C# и VB.NET

1. Простое конвертирование HTML-файла в DOCX-файл на языке C#:
            SautinSoft.HtmlToRtf h = new SautinSoft.HtmlToRtf();
            string inputFile = @"d:\sample.html";
            string outputFile = Path.ChangeExtension(inputFile, ".docx");
            if (h.OpenHtml(inputFile))
            {
                bool ok = h.ToDocx(outputFile);
            }
2. Конвертирование потока HTML-файлов в поток DOCX на C#:
            SautinSoft.HtmlToRtf h = new SautinSoft.HtmlToRtf();
            string inputFile = @"d:\utf-8.html";
            string outputFile = Path.ChangeExtension(inputFile, ".docx");

            // Укажите свойство 'BaseURL', чтобы компонент мог найти полный путь к изображениям, например: < img src="..\pict.png" и
            // к внешнему CSS, например:  < link rel="stylesheet" href="/css/style.css">.
            h.BaseURL = Path.GetFullPath(inputFile);
            using (FileStream htmlFileStream = new FileStream(inputFile, FileMode.Open))
            {
                if (h.OpenHtml(htmlFileStream))
                {
                    using (MemoryStream docxMemoryStream = new MemoryStream())
                    {
                        bool ok = h.ToDocx(docxMemoryStream);
                    }
                }
            }
3. Преобразование HTML в DOCX в памяти с помощью VB.NET:

        Dim h As New SautinSoft.HtmlToRtf()
        Dim inputFile As String = "d:\pic.html"
        Dim outputFile As String = Path.ChangeExtension(inputFile, ".docx")

        ' Прочитайте наш HTML-файл в байтах.
        Dim htmlBytes() As Byte = File.ReadAllBytes(inputFile)

        ' Укажите свойство 'BaseURL', чтобы компонент мог найти полный путь к изображениям, например:< img src="..\pict.png" и
        ' к внешнему CSS, например:  < link rel="stylesheet" href="/css/style.css">.
        h.BaseURL = Path.GetFullPath(inputFile)
        If h.OpenHtml(htmlBytes) Then
            Dim docxBytes() As Byte = h.ToDocx()

            ' Откройте результат для демонстрации.
            If docxBytes IsNot Nothing Then
                File.WriteAllBytes(outputFile, docxBytes)
                System.Diagnostics.Process.Start(New System.Diagnostics.ProcessStartInfo(outputFile)
                      With {.UseShellExecute = True})
            End If
        End If
4. Преобразование HTML в DOCX на C#; добавление пользовательского заголовка страницы из HTML и нижнего колонтитула из другого RTF:
            SautinSoft.HtmlToRtf h = new SautinSoft.HtmlToRtf();
            string inputFile = @"d:\document.html";
            string outputFile = Path.ChangeExtension(inputFile, ".docx");

            // Установите верхний и нижний колонтитулы страницы.
            string headerFromHtml = File.ReadAllText(@"d:\header.html");
            string footerFromRtf = File.ReadAllText(@"d:\footer.rtf");

            // Добавьте заголовок страницы.
            h.PageStyle.PageHeader.Html(headerFromHtml);

            //Добавьте дополнительное пространство между заголовком и содержимым страницы.
            h.PageStyle.PageHeader.MarginBottom.Mm(10);

            // Добавьте нижний колонтитул страницы.
            h.PageStyle.PageFooter.Rtf(footerFromRtf);

            if (h.OpenHtml(inputFile))
            {
                bool ok = h.ToDocx(outputFile);
            }
5. Добавление нумерации страниц во время конвертирования HTML в DOCX на C#:
            SautinSoft.HtmlToRtf h = new SautinSoft.HtmlToRtf();
            string inputFile = @"..\..\sample.html";
            string outputFile = Path.ChangeExtension(inputFile, ".docx");

            // Добавьте нумерацию страниц.
            // Установите номера страниц с 1- й страницы
            h.PageStyle.PageNumbers.Appearance = SautinSoft.HtmlToRtf.ePageNumberingAppearence.PageNumFirst;

            // Выровняйте номера страниц по верхнему центру
            h.PageStyle.PageNumbers.AlignV = SautinSoft.HtmlToRtf.eAlign.Top;
            h.PageStyle.PageNumbers.AlignH = SautinSoft.HtmlToRtf.eAlign.Center;

            // Установите формат номеров страниц как "Страница 1 из 20".
            h.PageStyle.PageNumbers.Format = "Page {page} of {numpages}";

            // Установите шрифт номеров страниц: Calibri, 19.
            h.PageStyle.PageNumbers.Font.Face = SautinSoft.HtmlToRtf.eFontFace.f_Calibri;
            h.PageStyle.PageNumbers.Font.Size = 19;
            if (h.OpenHtml(inputFile))
            {
                bool ok = h.ToDocx(outputFile);
            }


Есть вопрос?

  • Если у Вас есть вопросы,
  • нужна помощь
  • или пример кода как конвертировать на C#, VB.NET, ASP.NET,
обращайтесь в нашу службу поддержки по адресу support@sautinsoft.com или спросите в онлайн-чате (правый нижний угол этой страницы). Мы Вам обязательно поможем!


Преимущества «HTML to RTF .Net»

  1. Экономия времени и никаких затрат на разработку продукта.

    Нет смысла разрабатывать свой компонент HTML to DOCX на С#. Это требует много дней напряженной работы и занимает около 20 000 строк кода. «HTML to RTF .Net» сэкономит Ваше время! Нужно только добавить ссылку на "SautinSoft.HtmlToRtf.dll" и написать 3-4 строки на C#.

  2. Компонент предоставляет набор API для конвертирования HTML: 3.2, 4.01, 5, с CSS и XHTML в DOCX, RTF, текст и для слияния RTF-файлов.

  3. «HTML to RTF .Net» является абсолютно автономным компонентом. Не нужно иметь MS Word, Internet Explorer или другое ПО для конвертирования и редактирования документов.

  4. Вы оплачиваете один раз и пользуетесь «HTML to RTF .Net» без каких-либо дополнительных сборов. Лицензия никогда не истекает.

  5. В качестве бонуса Вы получате неограниченную техническую поддержку независимо от даты Вашего приобретения.

Если Вас заинтересовал наш продукт, Вы можете скачать демо-версию тут или посмотреть цены на «HTML to RTF .Net».

 
 
Программы Скачать Помощь О компании
SautinSoft on Facebook SautinSoft on Twitter SautinSoft on Youtube Our Blog
Авторское право © 2002 - 2021 SautinSoft (начало с сайта sautin.com). Все права защищены.