Aspose.OCR Счет-фактура в текст для .NET
Aspose.OCR Invoice to Text for .NET является специализированным плагином, предназначенным для упрощения извлечения структурированного текста из сканированных или фотографируемых счетов. путем автоматизации ключевых шагов — предварительной обработки изображений, анализа расположения и OCR — вы можете хранить полученные данные непосредственно в бухгалтерские системы, базы данных или платформы оплаты без ручного перезагрузки. Плагина использует одно и то же высококачественное ОКР ядро, что и аспосе.ОЦР, оптимизировано для расчётов счета, таблиц и ключовых ценных паров. Вы сократите время обрабатывания, минимизируете человеческую ошибку и получите последовательные, точные результаты по шкале.
Инсталляция и установка
Следите за этими шагами, чтобы добавить Aspose.OCR Invoice в текст для .NET к вашему проекту:
- Настройка через NuGet или загрузка пакета с серверов Aspose. для подробных инструкций см Инсталляция .
- Настройка мерного лицензирования на стартапе приложения, чтобы избежать ограничений по оценке Лицензирование с учетом объема потребления .
Пример: распознавание счетов
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Особенности и функции
Инфо-специфический двигатель OCR
- Прилагожденные модели распознавания для печатанных и фотографированных счетов.
- Высокая толерантность к различным резолюциям, уровню шума и углам.
- Признание нескольких языков и цифровых стилей в одном документе.
Image Preprocessing & Улучшение
- Автоматические фильтры отклонения, отключения и бинарности для улучшения читаемости.
- Адаптивный порог, который сохраняет линии счетов и границы стола.
- Яркость и контрастные корректировки для управления под- или избыточным сканированием.
Анализ расположения и табличная детекция
- Автоматическая идентификация заголовка, футера, таблицы линейных элементов и резюме блоков.
- Признание рядов, колонн и клеточных границ, даже при недостаточном или отсутствии управляющих линий.
- Экстракция настенных таблиц (например, подэтимы под элементом материнской линии).
Ключевое значение двойной экстракции
- Конфигурируемые шаблоны для карты имен полей (например, «номер счета», «Total Due») для результатов ОКР.
- Поддержка динамических етикетов — обнаруживает близость текста, а не строгое соответствие шаблонов.
- Рейтинг доверия по поле, позволяющий фильтровать или перерабатывать элементы с низким доверием.
Экспорт и интеграция
- Выходные форматы: плоский текст, JSON, XML, PDF, Word или HTML.
- События позволяют перехватывать сырые результаты ОКР перед сериализацией.
- Поддержка обработки батарей с паралельными контролями для рабочих нагрузок высокого объема.
Управление ошибками и логинг
- Подробные сообщения об исключении для распространенных режимов неудачи (например, не поддерживаемый формат изображения, проблемы с лицензией).
- Встроенный логинг-интерфейс совместим с популярными .NET-регистрационными рамками (Serilog, NLog и log4net).
- Политики удаления для переходных ошибок во время файла I/O или расположения памяти.
Советы и лучшие практики
- Превализированная резолюция изображения: для наилучшей точности OCR, подача изображений на или выше 300 ДПИ.
- Используйте красные или цветные изображения — только бинарные входы могут потерять тонкие табличные линии.
- Сделайте лимиты доверия в соответствии с качеством ваших данных; более низкие лимы поймают больше данных, но могут потребоваться пониженная валидация.
- Для очень больших комплектов следует следить за использованием памяти и корректировать параллелизм с помощью опций обработки плагина.
- Погрузите функцию шаблона ключевой стоимости, чтобы заморозить ожидаемые расстройства счета; для неизвестных расстроек, возвратитесь к генерическому расчету таблицы.
- Всегда инициализируйте Метрированную лицензию, прежде чем обращаться к любым методам ОКР, чтобы избежать оценки-мода водных знаков.
Соблюдая эти рекомендации и используя свои счетно-центрические возможности, Aspose.OCR Invoice to Text for .NET позволяет вам построить надежные, кон-до-кон-процессуальные трубопроводы — минимизируя ручную нагрузку и максимально увеличивая пропускную способность.