ASPOSE.OCR фактура за текст за .NET

Aspose.OCR Invoice to Text за .NET е специализиран плъгин, предназначен да улесни извличането на структуриран текст от сканирани или фотографирани фактури. Чрез автоматизиране на ключовите стъпки — предварително обработване на изображения, анализ на оформлението и OCR — можете да снабдите получените данни директно в счетоводни системи, бази данни или платформи за плащане без ръчно редистрибуция. Плъгинът осигурява същото висококачествено ОКР ядро, както и аспосе.ОЦР, оптимизирано за фактурни оформления, таблици и двойки с ценни стойности. Ще намалите времето за обработка, минимизирате човешката грешка и получите последователни, точни резултати по мащаб.

Инсталация и инсталиране

Следвайте следните стъпки, за да добавите Aspose.OCR Invoice към Текст за .NET към вашия проект:

  • Инсталиране чрез NuGet или изтегляне на пакета от сървърите на Aspose. за подробни инструкции, вижте инсталация .
  • Конфигуриране на измерване на лицензията при стартиращи приложения, за да се избегнат ограничения за оценяване Размер на лицензията .

Пример: Предоставяне на фактури

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Характеристики и функционалности

Инвестиционно-специфичен OCR двигател

  • Приспособени модели за разпознаване на печатни и фотографирани фактури.
  • Висока толерантност към различни резолюции, нива на шум и скъпи ъгли.
  • Признаване на няколко езика и цифрови стилове в един и същ документ.

Преработване и подобряване на изображението

  • Автоматични филтри за оттегляне, отнемане и бинарност за подобряване на легитимността.
  • Адаптивен праг, който запазва линията на фактурата и границите на таблицата.
  • Блестящи и контрастни настройки за справяне с под- или прекомерно изложени скани.

Анализ на слоевете и таблична детекция

  • Автоматична идентификация на заглавието, стъпалото, таблицата на линиите и обобщените блокове.
  • Разпознаване на редове, колони и клетъчни граници, дори когато ръководни линии са слаби или липсват.
  • Извличане на ностени таблици (напр. под-елементи под елемент от родителска линия).

Ключова стойност двойна екстракция

  • Конфигурируеми шаблони за имената на полето на картата (напр. „Номер на фактурата“, „Total Due“) за резултатите от ОКР.
  • Поддръжка за динамични етикети – открива близостта на текста, а не строгото съвпадение на шаблоните.
  • Рекордиране на доверието по поле, което ви позволява да филтрирате или репродуцирате елементи с ниско доверие.

Експорт и интеграция

  • Изходни формати: ясен текст, JSON, XML, PDF, Word или HTML.
  • Събитията се превръщат в сурови резултати от OCR преди сериализацията.
  • Поддръжка за обработка на батерии с паралелни контроли за висококачествени работни натоварвания.

Управление на грешки и регистрация

  • Подробни изключителни съобщения за общи режими на неуспех (например, неподдържан формат на изображението, проблеми с лицензирането).
  • Инсталиран интерфейс за записване, съвместим с популярните .NET регистрационни рамки (Serilog, NLog и log4net).
  • Изтегляне на политики за преходни грешки по време на файла I/O или разпределение на паметта.

Съвети и най-добри практики

  • Предварително валидирана резолюция на изображението: за най-добра точност на OCR, предоставяте изображения при или над 300 DPI.
  • Използвайте сива скала или цветни изображения - бинарни само вход може да загуби фини таблични линии.
  • Направете лимити за поверителност в зависимост от качеството на данните си; по-ниските прагове улавят повече данни, но могат да изискват валидиране на долния поток.
  • За много големи комплекти, наблюдавайте използването на паметта и приспособявате паралелизма чрез опциите за обработка на плагина.
  • Изтеглете функцията на шаблона за ключова стойност, за да замразите очаквания дизайн на фактурата; за неизвестни дизайни, се връщате към генеричната таблична детекция.
  • Винаги инициализирайте Metred Licensing преди да се позовавате на каквито и да било методи на OCR, за да избегнете оценяване на водните знаци.

Чрез спазване на тези насоки и използването на неговите фактури-центрични възможности, Aspose.OCR Invoice to Text за .NET ви позволява да изградите надеждни, крайно-на-крайни трубопроводи за обработка на документи – да минимизирате ръчното усилие и да увеличите максималния пропуск.

 Български