Aspose.OCR сканира изображение в текст за .NET

Aspose.OCR Scanned Image to Text за .NET позволява на разработчиците да извличат текст от изображения, съдържащи големи количества структуриран съдържание – сканирани договори, споразумения, книги страници, статии, вестници и др., като същевременно запазват верността на оформлението (включително мулти-колонни потоци.

Инсталация и инсталиране

За да добавите Aspose.OCR Scanned Image в Text for .NET към вашия проект, инсталирайте пакета NuGet и конфигурирайте измервана лиценза:

  • Инсталиране чрез NuGet (виж подробни стъпки): инсталация
  • Възможност за измерване на лиценза преди първата употреба: Размер на лицензията След инсталиране, просто посочете името на Aspose.OCR в кодовите си файлове.

Характеристики и функционалности

Точна екстракция на текст

Основната OCR двигател прилага усъвършенствани алгоритми за разпознаване, изчерпани за скенираните документи. Той анализира пиксели, идентифицира фигурни форми срещу вградени обучени модели и произвежда текстови изходи на Unicode. Точността е оптимизирана за вход с висока резолюция и чисти скани.

Структуриран анализ на оформлението на документи

В допълнение към линията-по-линия текст запис, добавката разпределя структурните елементи – параграфи, заглавия, стъпки и таблици – чрез сегментиране на областите на изображението. признати блокове запазват пространствени отношения, позволявайки на разработчиците да реконструират потока от документи или да прилагат персонализиран пост-процесиране.

Мулти-колонно разпознаване

Скенираните страници често използват формати от две или три колони. двигателят на OCR автоматично открива границите на колоните, ги чете в естествения ред и сгъва текстовите сегменти обратно в един, правилно поръчан изходния поток.

Преработване и подобряване на изображението

Интегрирани рутини за предварителна обработка подобряват успеха на разпознаването при предизвикателни скани:

  • Скеу детектиране и автоматичен десктоп
  • Binarization (адаптивен праг)
  • Филтри за намаляване на шума (солта и пипер, гаузианско смазване)
  • Контраст и светлинна корекция Тези стъпки могат да бъдат проследени или персонализирани, за да отговарят на специфични сценарии за качество на изображението.

Поддръжка на език и характер

Въпреки че се фокусира върху структурирани английски текстове, двигателят поддържа много езици и символи, които са релевантни за скенираното правно, академично или техническо съдържание. Езикови пакети могат да бъдат заредени, за да се подобри разпознаването на не-латински скрипти или специализирани симболи.

Настройки за персонализиране

Опциите за фин тониране позволяват на разработчиците да балансират скоростта срещу точността:

  • Доверителни граници за характера и приемането на думите
  • Методи за сегментиране на страници (единствен блок, автоматичен текст)
  • Параметри на резолюция за скалиране на входящи изображения
  • Потребителски дефинирани речник за повишаване на разпознаването на конкретни термини

Изходни формати и обработка на данни

Извлечените текстове могат да бъдат извлечени като плоски Unicode ленти или потопени в текстови файлове.За усъвършенствани сценарии, се излагат метаданни за оформление (ограничаващи кутии, доверителни точки), така че приложенията да подчертават или проверяват признатите региони.

Управление на ефективността и ресурсите

Проектиран за обработка на комплекти от големи изображения, плагинът:

  • Намалява паметта чрез стрийминг страници
  • Предлага асинхронно разпознаване АПИ за паралелизиране на работното натоварване
  • Експозиция на параметрите за изчисляване на нишки и буферни размери

Безопасност и валута

Всички класи за разпознаване са защитени от нишки, което позволява едновременни задачи на OCR през няколко нива или асинхронни обаждания без блокиране на конфликти.

Поддръжка за лицензиране

Aspose.OCR Scanned Image to Text for .NET използва същия измерван модел на лицензиране, както и продуктите на Asposa.Call the Metered.InitiateLicensing method at application startup to bind consumption to your subscription meter.

Съвети и най-добри практики

  • Започнете с висококачествени скани (300 DPI или повече) за максимална точност.
  • Препроцесирайте изображенията, за да премахнете шума и правилното изхвърляне преди хранене в OCR.
  • Използвайте настройки за сегментиране на страницата, които съответстват на сложността на вашия дизайн.
  • Заредете само необходимите езикови пакети; чужди модели могат да забавят разпознаването.
  • Осигуряване на асинхронно разпознаване при обработката на големи парчета, за да се поддържа отзивният УИ.
  • Проверявайте резултатите от доверието и прилагайте гранична валидация или ръчен преглед за критични документи.
  • На разположение на OCR двигателни обекти бързо да се освободи неконтролирани ресурси.
  • Проследяване и използване на дневния метър, за да се избегнат неочаквани нарушения на квотите.
 Български