Рекомендации по определению границ и координат в PDF на C# и .Net

Работа с PDF-файлами часто требует точного определения границ и координат для выполнения различных задач, таких как извлечение текста, добавление аннотаций или редактирование содержимого. Мы рекомендуем использовать библиотеку SautinSoft.Pdf, которая предоставляет мощные инструменты для работы с PDF-файлами. В этой статье мы рассмотрим, как определить границы и координаты в PDF-файле на C# и .Net..

Пошаговое руководство:

  1. Добавить SautinSoft.PDF из NuGet.
  2. Загрузить PDF-документ.
  3. Указать номер страницы и текст, который необходимо найти.
  4. Вывести границы и координаты на консоль.

Входной файл:

Выходной результат:

Полный код

using System;
using System.IO;
using SautinSoft;
using SautinSoft.Pdf;
using SautinSoft.Pdf.Content;
using System.Linq;

namespace Sample
{
    class Sample
    {
        /// <summary>
        /// Find a specific text on page #2 in the PDF and show Bounds, Coordinates, Points.
        /// </summary>
        /// <remarks>
        /// Details: https://sautinsoft.com/products/pdf/help/net/developer-guide/bounds-and-coordinates.php
        /// </remarks>
        static void Main(string[] args)
        {
            // Before starting this example, please get a free trial key:
            // https://sautinsoft.com/start-for-free/

            // Apply the key here:
            // PdfDocument.SetLicense("...");

            string pdfFile = Path.GetFullPath(@"..\..\..\sample.pdf");

            using var document = PdfDocument.Load(pdfFile);
            // Page #2:
            var page = document.Pages[1];

            var foundText = page.Content.GetText().Find("Best Beaches:").FirstOrDefault();
            if (foundText != null)
                Console.WriteLine(foundText.Bounds);
        }
    }
}

Download

Option Infer On

Imports System
Imports System.IO
Imports SautinSoft
Imports SautinSoft.Pdf
Imports SautinSoft.Pdf.Content
Imports System.Linq

Namespace Sample
	Friend Class Sample
		''' <summary>
		''' Find a specific text on page #2 in the PDF and show Bounds, Coordinates, Points.
		''' </summary>
		''' <remarks>
		''' Details: https://sautinsoft.com/products/pdf/help/net/developer-guide/bounds-and-coordinates.php
		''' </remarks>
		Shared Sub Main(ByVal args() As String)
			' Before starting this example, please get a free trial key:
			' https://sautinsoft.com/start-for-free/

			' Apply the key here:
			' PdfDocument.SetLicense("...");

			Dim pdfFile As String = Path.GetFullPath("..\..\..\sample.pdf")

			Using document = PdfDocument.Load(pdfFile)
				' Page #2:
				Dim page = document.Pages(1)
	
				Dim foundText = page.Content.GetText().Find("Best Beaches:").FirstOrDefault()
				If foundText IsNot Nothing Then
					Console.WriteLine(foundText.Bounds)
				End If
			End Using
		End Sub
	End Class
End Namespace

Download


Если вам нужен пример кода или у вас есть вопрос: напишите нам по адресу support@sautinsoft.ru или спросите в онлайн-чате (правый нижний угол этой страницы) или используйте форму ниже:



Вопросы и предложения всегда приветствуются!

Мы разрабатываем компоненты .Net с 2002 года. Мы знаем форматы PDF, DOCX, RTF, HTML, XLSX и Images. Если вам нужна помощь в создании, изменении или преобразовании документов в различных форматах, мы можем вам помочь. Мы напишем для вас любой пример кода абсолютно бесплатно.