Az ASPOSE.OCR számla a szöveghez .NET
Az ASPOSE.OCR számla a szöveghez .NET egy speciális plug-in célja, hogy egyszerűsítse a strukturált szöveg kivonását a szkennelt vagy fényképezett számlákból. A kulcsfontosságú lépések automatizálásával - kép előfeldolgozása, elrendezési elemzés és OCR - az eredményes adatokat közvetlenül a számviteli rendszerekbe, adatbázisokba vagy fizetési platformokra táplálhatja kézi átalakítás nélkül. Az plugin ugyanazt a magas színvonalú OCR magot használja, mint az ASPSE, amely optimalizálva van számlákat, táblákat és kulcsszavazási párokat. Csökkenti a feldolgozás idejét, minimalizálja az emberi hibát, és következetes, pontos eredményeket szerez.
Telepítés és telepítés
Kövesse ezeket a lépéseket, hogy hozzáadja Aspose.OCR számlát a .NET szöveghez a projekthez:
- Telepítse a NuGet-en keresztül vagy töltse le a csomagot az Aspose szerverekről. részletes utasításokért lásd telepítés .
- Állítsa be a mért licencet az alkalmazás indításakor, hogy elkerüljék az értékelési korlátozásokat Mérett licenc .
Példa: A számlák elismerése
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Jellemzők és funkciók
Számla-specifikus OCR motor
- A nyomtatott és fényképezett számlák elismerési modelljei.
- Magas tolerancia a különböző felbontásokhoz, zajszintekhez és csúszó szögekhez.
- Többnyelv és digitális stílus azonos dokumentumban történő felismerése.
Képek előfeldolgozása és javítása
- Automatikus leválasztás, lefedettség és bináris szűrők a olvashatóság javítása érdekében.
- Adaptív küszöbérték, amely megőrzi a számlázási vonalakat és az asztali határokat.
- A fényesség és a kontraszt beállítása az alatti vagy túlsúlyos szkennelések kezelésére.
Layout elemzés és asztali felismerés
- Automatikus azonosítás a címke, lábfej, sor elemek táblázat, és összefoglaló blokkok.
- A sorok, oszlopok és sejthatárok felismerése, még akkor is, ha az irányító vonalak gyengék vagy hiányoznak.
- A nemes táblák kivonása (például a szubjektumok egy szülő vonal alatti elem alatt).
Kulcsfontosságú pár kivonás
- Konfigurálható sablonok a térkép mezőnevekhez (például „Fontszám”, „Total Due”) az OCR eredményeihez.
- A dinamikus címkék támogatása – a szigorú sablonok megfelelése helyett a szöveg közelségét észleli.
- Bizalmi pontszámok mezőnként, lehetővé téve az alacsony bizalmi elemek szűrését vagy újrahasznosítását.
Export és integráció
- A kimeneti formátumok: tiszta szöveg, JSON, XML, PDF, Word vagy HTML.
- Az események megakadályozzák a nyers OCR eredményeket a serializáció előtt.
- Batch feldolgozási támogatás párhuzamos vezérlővel a nagy mennyiségű munkafogyasztáshoz.
Hibaelhárítás és logging
- Részletes kivételes üzenetek a közös hibás módokhoz (például nem támogatott képformátum, engedélyezési problémák).
- A beépített naplózás interfész kompatibilis a népszerű .NET naplózási keretekkel (Serilog, NLog és log4net).
- Az átmeneti hibák visszavonási politikája a fájl I/O vagy a memória elosztása során.
Tippek és legjobb gyakorlatok
- Előre érvényesített képfelbontás: a legjobb OCR pontosság érdekében képeket szállít 300 DPI-nál vagy annál nagyobb mértékben.
- Használjon szürke színű vagy színes képeket – csak a bináris bevitelek elveszíthetik a finom asztali vonalokat.
- A bizalmi küszöbértékeket az adatok minőségével összhangban helyezzük el; az alacsonyabb határértékek több adatot kapnak, de lefelé érvényesítést igényelhetnek.
- Nagyon nagy csomagok esetén figyelemmel kíséri a memória használatát és szabályozza a párhuzamot a plug-in feldolgozási lehetőségek segítségével.
- A kulcsszó-érték-sablon funkciót a várt számlázási elrendezések befagyasztására; ismeretlen elhelyezések esetén visszatér a generikus asztali felismeréshez.
- Mindig kezdeményezze a Mérsékelt Licencelést, mielőtt bármilyen OCR módszert alkalmazna, hogy elkerülje az értékelési mód vízjelzőit.
Ezeknek az iránymutatásoknak a megfelelésével és számla-központú képességeinek kihasználásával Aspose.OCR számlázás a szöveghez .NET lehetővé teszi, hogy megbízható, végső-végső dokumentumfeldolgozó csővezetékeket építsen – minimalizálva a kézi erőfeszítést és a maximális átjárhatóságot.