Az Aspose.OCR szinkronizálja a képet a szöveghez .NET

Aspose.OCR Scanned Image to Text for .NET lehetővé teszi a fejlesztők számára, hogy kivonják a szöveget a nagy mennyiségű strukturált tartalmat tartalmazó képekből - szkennelt szerződések, megállapodások, könyves oldalak, cikkeket, újságok és így tovább - miközben megőrzik a layout hűségét (beleértve a több oszlop áramlását.

Telepítés és telepítés

Ahhoz, hogy a projekthez hozzáadja az Aspose.OCR Scanned Image-t a .NET szöveghez, telepítse a NuGet csomagot, és állítsa be a mérett licencet:

A NuGet segítségével telepítve (lásd a részletes lépéseket): telepítés
Az első használat előtt mérhető engedélyezést lehetővé teszi: Mérett licenc A telepítés után egyszerűen hivatkozzon az Aspose.OCR névterületre a kódfájlokban.

Jellemzők és funkciók

Pontos szövegek kivonása

A központi OCR motor fejlett felismerési algoritmusokat alkalmaz a szkennelt dokumentumok számára. elemzi a pixeleket, azonosítja a karakter alakjait a beépített képzett modellekkel szemben, és Unicode szöveges kimenetet termel.

A strukturált dokumentumok elrendezésének elemzése

A line-by-line szöveges rögzítésen túl a plugin szerkezeti elemeit – bekezdéseket, címet, lábakat és táblákat – szegmentálva a kép régióit. A felismert blokkok helyes kapcsolatokat tartanak fenn, lehetővé téve a fejlesztők számára, hogy újjáépítsék a dokumentumáramlást vagy alkalmazzák a személyre szabott post-feldolgozást.

Multi-Column Layout felismerés

A szkennelt oldalak gyakran két- vagy három oszlopos formátumokat használnak.Az OCR motor automatikusan észleli a sziklák határait, természetes sorrendben olvassa el őket, és a szöveges szegmenseket egy, helyesen megrendelt kimeneti áramba helyezi vissza.

Kép előfeldolgozása és javítása

Az integrált előfeldolgozási rutinok javítják a felismerés sikereit a kihívást jelentő szkenneléseken:

Skew felismerés és automatikus leállás
Binarizáció (adaptív küszöbérték)
zajcsökkentő szűrők (salt- és paprika, Gaussian öntözés)
A kontraszt és a fényesség kiigazítása Ezek a lépések megtekinthetők vagy személyre szabhatók, hogy megfeleljenek a konkrét képminőségi forgatókönyveknek.

Nyelv és karakter támogatás

Bár a strukturált angol szövegekre összpontosít, a motor több nyelvet és karakterkészletet támogat, amelyek a szkennelt jogi, tudományos vagy műszaki tartalmakhoz kapcsolódnak.

Megfelelő felismerési beállítások

A fin-tuning opciók lehetővé teszik a fejlesztők számára, hogy kiegyensúlyozzák a sebességet a pontosság ellen:

Bizalmi küszöbök a karakter és a szó elfogadására
Oldalszegmentációs módok (egy blokk, automatikus, sparse szöveg)
Felszólalási paraméterek a belépő képek méretezéséhez
Felhasználó által meghatározott szótárak a domain-specifikus kifejezések felismerésének növelésére

A kimeneti formátumok és az adatkezelés

Az eltávolított szöveget egyenes Unicode szalagként lehet visszavonni vagy szövegfájlokba áramolni. fejlett forgatókönyvek esetén a layout metadata (bontó dobozok, bizalom pontszámok) feltüntethető, így a alkalmazások kiemelik vagy ellenőrizhetik a felismert területeket.

teljesítmény és erőforrás menedzsment

A nagy képkészletek csomagkezelésére tervezték, a plugin:

Minimalizálja a memóriát a streaming oldalakkal
Asynchronous felismerési API-kat kínál a munkaköltségek párhuzamosításához
Kimutatja a szalagszámítási paramétereket és a buffer méreteket

Thread Biztonság és valuta

Minden felismerési osztály vezeték-biztonságos, lehetővé téve egyidejű OCR feladatok több vonal vagy aszinkron hívások záró konfliktusok nélkül. Ez ideális a szerver oldalán elhelyezések vagy nagy teljesítményű szolgáltatások.

Mérsékelt engedélyezési támogatás

Az Aspose.OCR Scanned Image to Text for .NET ugyanazt a mérett licencmodellet használja, mint az ASPOSE termékek. hívja a Metered.InitiateLicensing módszert az alkalmazás indításakor, hogy összekapcsolja a fogyasztást az előfizetés mérőjéhez.

Tippek és legjobb gyakorlatok

Kezdje a kiváló minőségű szkenneléssel (300 DPI vagy annál magasabb) a pontosság maximalizálása érdekében.
Preprocess képek, hogy távolítsa el a zaj és a helyes szeletelést, mielőtt táplálja az OCR.
Használjon olyan oldalsegmentációs beállításokat, amelyek megfelelnek a layout összetettségének.
Töltse csak a szükséges nyelvi csomagok; idegen modellek lehet lassú felismerés.
Lehetővé teszi az aszinkron felismerést a nagy töredékek feldolgozásakor, hogy az UI reagáljon.
Ellenőrizze a bizalmi pontszámokat, és alkalmazza a határon alapuló hitelesítést vagy a kritikus dokumentumok kézi felülvizsgálatát.
Az OCR motor tárgyak rendelkezésre állása azonnal a nem irányított források felszabadításához.
Nyomon követés és log mérő használata, hogy elkerüljék a váratlan kvóták megsértését.