Az ASPOSE.OCR szinkronizálja a képet a szöveghez .NET
Aspose.OCR Scanned Image to Text for .NET lehetővé teszi a fejlesztők számára, hogy kivonják a szöveget a nagy mennyiségű strukturált tartalmat tartalmazó képekből - szkennelt szerződések, megállapodások, könyves oldalak, cikkeket, újságok és így tovább - miközben megőrzik a layout hűségét (beleértve a több oszlop áramlását.
Telepítés és telepítés
Ahhoz, hogy a projekthez hozzáadja az Aspose.OCR Scanned Image-t a .NET szöveghez, telepítse a NuGet csomagot, és állítsa be a mérett licencet:
- A NuGet segítségével telepítve (lásd a részletes lépéseket): telepítés
- Az első használat előtt mérhető engedélyezést lehetővé teszi: Mérett licenc A telepítés után egyszerűen hivatkozzon az Aspose.OCR névterületre a kódfájlokban.
Jellemzők és funkciók
Pontos szövegek kivonása
A központi OCR motor fejlett felismerési algoritmusokat alkalmaz a szkennelt dokumentumok számára. elemzi a pixeleket, azonosítja a karakter alakjait a beépített képzett modellekkel szemben, és Unicode szöveges kimenetet termel.
A strukturált dokumentumok elrendezésének elemzése
A line-by-line szöveges rögzítésen túl a plugin szerkezeti elemeit – bekezdéseket, címet, lábakat és táblákat – szegmentálva a kép régióit. A felismert blokkok helyes kapcsolatokat tartanak fenn, lehetővé téve a fejlesztők számára, hogy újjáépítsék a dokumentumáramlást vagy alkalmazzák a személyre szabott post-feldolgozást.
Multi-Column Layout felismerés
A szkennelt oldalak gyakran két- vagy három oszlopos formátumokat használnak.Az OCR motor automatikusan észleli a sziklák határait, természetes sorrendben olvassa el őket, és a szöveges szegmenseket egy, helyesen megrendelt kimeneti áramba helyezi vissza.
Kép előfeldolgozása és javítása
Az integrált előfeldolgozási rutinok javítják a felismerés sikereit a kihívást jelentő szkenneléseken:
- Skew felismerés és automatikus leállás
- Binarizáció (adaptív küszöbérték)
- zajcsökkentő szűrők (salt- és paprika, Gaussian öntözés)
- A kontraszt és a fényesség kiigazítása Ezek a lépések megtekinthetők vagy személyre szabhatók, hogy megfeleljenek a konkrét képminőségi forgatókönyveknek.
Nyelv és karakter támogatás
Bár a strukturált angol szövegekre összpontosít, a motor több nyelvet és karakterkészletet támogat, amelyek a szkennelt jogi, tudományos vagy műszaki tartalmakhoz kapcsolódnak.
Megfelelő felismerési beállítások
A fin-tuning opciók lehetővé teszik a fejlesztők számára, hogy kiegyensúlyozzák a sebességet a pontosság ellen:
- Bizalmi küszöbök a karakter és a szó elfogadására
- Oldalszegmentációs módok (egy blokk, automatikus, sparse szöveg)
- Felszólalási paraméterek a belépő képek méretezéséhez
- Felhasználó által meghatározott szótárak a domain-specifikus kifejezések felismerésének növelésére
A kimeneti formátumok és az adatkezelés
Az eltávolított szöveget egyenes Unicode szalagként lehet visszavonni vagy szövegfájlokba áramolni. fejlett forgatókönyvek esetén a layout metadata (bontó dobozok, bizalom pontszámok) feltüntethető, így a alkalmazások kiemelik vagy ellenőrizhetik a felismert területeket.
teljesítmény és erőforrás menedzsment
A nagy képkészletek csomagkezelésére tervezték, a plugin:
- Minimalizálja a memóriát a streaming oldalakkal
- Asynchronous felismerési API-kat kínál a munkaköltségek párhuzamosításához
- Kimutatja a szalagszámítási paramétereket és a buffer méreteket
Thread Biztonság és valuta
Minden felismerési osztály vezeték-biztonságos, lehetővé téve egyidejű OCR feladatok több vonal vagy aszinkron hívások záró konfliktusok nélkül. Ez ideális a szerver oldalán elhelyezések vagy nagy teljesítményű szolgáltatások.
Mérsékelt engedélyezési támogatás
Az Aspose.OCR Scanned Image to Text for .NET ugyanazt a mérett licencmodellet használja, mint az ASPOSE termékek. hívja a Metered.InitiateLicensing módszert az alkalmazás indításakor, hogy összekapcsolja a fogyasztást az előfizetés mérőjéhez.
Tippek és legjobb gyakorlatok
- Kezdje a kiváló minőségű szkenneléssel (300 DPI vagy annál magasabb) a pontosság maximalizálása érdekében.
- Preprocess képek, hogy távolítsa el a zaj és a helyes szeletelést, mielőtt táplálja az OCR.
- Használjon olyan oldalsegmentációs beállításokat, amelyek megfelelnek a layout összetettségének.
- Töltse csak a szükséges nyelvi csomagok; idegen modellek lehet lassú felismerés.
- Lehetővé teszi az aszinkron felismerést a nagy töredékek feldolgozásakor, hogy az UI reagáljon.
- Ellenőrizze a bizalmi pontszámokat, és alkalmazza a határon alapuló hitelesítést vagy a kritikus dokumentumok kézi felülvizsgálatát.
- Az OCR motor tárgyak rendelkezésre állása azonnal a nem irányított források felszabadításához.
- Nyomon követés és log mérő használata, hogy elkerüljék a váratlan kvóták megsértését.