ASPOSE.OCR фактура за текст за .NET
Aspose.OCR Invoice to Text за .NET е специализиран плъгин, предназначен да улесни извличането на структуриран текст от сканирани или фотографирани фактури. Чрез автоматизиране на ключовите стъпки — предварително обработване на изображения, анализ на оформлението и OCR — можете да снабдите получените данни директно в счетоводни системи, бази данни или платформи за плащане без ръчно редистрибуция. Плъгинът осигурява същото висококачествено ОКР ядро, както и аспосе.ОЦР, оптимизирано за фактурни оформления, таблици и двойки с ценни стойности. Ще намалите времето за обработка, минимизирате човешката грешка и получите последователни, точни резултати по мащаб.
Инсталация и инсталиране
Следвайте следните стъпки, за да добавите Aspose.OCR Invoice към Текст за .NET към вашия проект:
- Инсталиране чрез NuGet или изтегляне на пакета от сървърите на Aspose. за подробни инструкции, вижте инсталация .
- Конфигуриране на измерване на лицензията при стартиращи приложения, за да се избегнат ограничения за оценяване Размер на лицензията .
Пример: Предоставяне на фактури
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Характеристики и функционалности
Инвестиционно-специфичен OCR двигател
- Приспособени модели за разпознаване на печатни и фотографирани фактури.
- Висока толерантност към различни резолюции, нива на шум и скъпи ъгли.
- Признаване на няколко езика и цифрови стилове в един и същ документ.
Преработване и подобряване на изображението
- Автоматични филтри за оттегляне, отнемане и бинарност за подобряване на легитимността.
- Адаптивен праг, който запазва линията на фактурата и границите на таблицата.
- Блестящи и контрастни настройки за справяне с под- или прекомерно изложени скани.
Анализ на слоевете и таблична детекция
- Автоматична идентификация на заглавието, стъпалото, таблицата на линиите и обобщените блокове.
- Разпознаване на редове, колони и клетъчни граници, дори когато ръководни линии са слаби или липсват.
- Извличане на ностени таблици (напр. под-елементи под елемент от родителска линия).
Ключова стойност двойна екстракция
- Конфигурируеми шаблони за имената на полето на картата (напр. „Номер на фактурата“, „Total Due“) за резултатите от ОКР.
- Поддръжка за динамични етикети – открива близостта на текста, а не строгото съвпадение на шаблоните.
- Рекордиране на доверието по поле, което ви позволява да филтрирате или репродуцирате елементи с ниско доверие.
Експорт и интеграция
- Изходни формати: ясен текст, JSON, XML, PDF, Word или HTML.
- Събитията се превръщат в сурови резултати от OCR преди сериализацията.
- Поддръжка за обработка на батерии с паралелни контроли за висококачествени работни натоварвания.
Управление на грешки и регистрация
- Подробни изключителни съобщения за общи режими на неуспех (например, неподдържан формат на изображението, проблеми с лицензирането).
- Инсталиран интерфейс за записване, съвместим с популярните .NET регистрационни рамки (Serilog, NLog и log4net).
- Изтегляне на политики за преходни грешки по време на файла I/O или разпределение на паметта.
Съвети и най-добри практики
- Предварително валидирана резолюция на изображението: за най-добра точност на OCR, предоставяте изображения при или над 300 DPI.
- Използвайте сива скала или цветни изображения - бинарни само вход може да загуби фини таблични линии.
- Направете лимити за поверителност в зависимост от качеството на данните си; по-ниските прагове улавят повече данни, но могат да изискват валидиране на долния поток.
- За много големи комплекти, наблюдавайте използването на паметта и приспособявате паралелизма чрез опциите за обработка на плагина.
- Изтеглете функцията на шаблона за ключова стойност, за да замразите очаквания дизайн на фактурата; за неизвестни дизайни, се връщате към генеричната таблична детекция.
- Винаги инициализирайте Metred Licensing преди да се позовавате на каквито и да било методи на OCR, за да избегнете оценяване на водните знаци.
Чрез спазване на тези насоки и използването на неговите фактури-центрични възможности, Aspose.OCR Invoice to Text за .NET ви позволява да изградите надеждни, крайно-на-крайни трубопроводи за обработка на документи – да минимизирате ръчното усилие и да увеличите максималния пропуск.