Aspose.OCR Счет-фактура в текст для .NET

Aspose.OCR Invoice to Text for .NET является специализированным плагином, предназначенным для упрощения извлечения структурированного текста из сканированных или фотографируемых счетов. путем автоматизации ключевых шагов — предварительной обработки изображений, анализа расположения и OCR — вы можете хранить полученные данные непосредственно в бухгалтерские системы, базы данных или платформы оплаты без ручного перезагрузки. Плагина использует одно и то же высококачественное ОКР ядро, что и аспосе.ОЦР, оптимизировано для расчётов счета, таблиц и ключовых ценных паров. Вы сократите время обрабатывания, минимизируете человеческую ошибку и получите последовательные, точные результаты по шкале.

Инсталляция и установка

Следите за этими шагами, чтобы добавить Aspose.OCR Invoice в текст для .NET к вашему проекту:

Пример: распознавание счетов

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Особенности и функции

Инфо-специфический двигатель OCR

  • Прилагожденные модели распознавания для печатанных и фотографированных счетов.
  • Высокая толерантность к различным резолюциям, уровню шума и углам.
  • Признание нескольких языков и цифровых стилей в одном документе.

Image Preprocessing & Улучшение

  • Автоматические фильтры отклонения, отключения и бинарности для улучшения читаемости.
  • Адаптивный порог, который сохраняет линии счетов и границы стола.
  • Яркость и контрастные корректировки для управления под- или избыточным сканированием.

Анализ расположения и табличная детекция

  • Автоматическая идентификация заголовка, футера, таблицы линейных элементов и резюме блоков.
  • Признание рядов, колонн и клеточных границ, даже при недостаточном или отсутствии управляющих линий.
  • Экстракция настенных таблиц (например, подэтимы под элементом материнской линии).

Ключевое значение двойной экстракции

  • Конфигурируемые шаблоны для карты имен полей (например, «номер счета», «Total Due») для результатов ОКР.
  • Поддержка динамических етикетов — обнаруживает близость текста, а не строгое соответствие шаблонов.
  • Рейтинг доверия по поле, позволяющий фильтровать или перерабатывать элементы с низким доверием.

Экспорт и интеграция

  • Выходные форматы: плоский текст, JSON, XML, PDF, Word или HTML.
  • События позволяют перехватывать сырые результаты ОКР перед сериализацией.
  • Поддержка обработки батарей с паралельными контролями для рабочих нагрузок высокого объема.

Управление ошибками и логинг

  • Подробные сообщения об исключении для распространенных режимов неудачи (например, не поддерживаемый формат изображения, проблемы с лицензией).
  • Встроенный логинг-интерфейс совместим с популярными .NET-регистрационными рамками (Serilog, NLog и log4net).
  • Политики удаления для переходных ошибок во время файла I/O или расположения памяти.

Советы и лучшие практики

  • Превализированная резолюция изображения: для наилучшей точности OCR, подача изображений на или выше 300 ДПИ.
  • Используйте красные или цветные изображения — только бинарные входы могут потерять тонкие табличные линии.
  • Сделайте лимиты доверия в соответствии с качеством ваших данных; более низкие лимы поймают больше данных, но могут потребоваться пониженная валидация.
  • Для очень больших комплектов следует следить за использованием памяти и корректировать параллелизм с помощью опций обработки плагина.
  • Погрузите функцию шаблона ключевой стоимости, чтобы заморозить ожидаемые расстройства счета; для неизвестных расстроек, возвратитесь к генерическому расчету таблицы.
  • Всегда инициализируйте Метрированную лицензию, прежде чем обращаться к любым методам ОКР, чтобы избежать оценки-мода водных знаков.

Соблюдая эти рекомендации и используя свои счетно-центрические возможности, Aspose.OCR Invoice to Text for .NET позволяет вам построить надежные, кон-до-кон-процессуальные трубопроводы — минимизируя ручную нагрузку и максимально увеличивая пропускную способность.

 Русский