Aspose.OCR faktúra na text pre .NET
Aspose.OCR Invoice to Text for .NET je špecializovaný plug-in navrhnutý tak, aby zjednodušil extrakciu štruktúrovaného textu z skenovaných alebo fotografovaných faktúr. Automatizáciou kľúčových krokov – predbežného spracovania obrazu, analýzy rozloženia a OCR – môžete kŕmiť výsledné údaje priamo do účtovných systémov, databáz alebo platobných platforiem bez manuálneho re-typingu.
Inštalácia a nastavenie
Postupujte podľa týchto krokov, aby ste do vášho projektu pridali Aspose.OCR Invoice do textu pre .NET:
- Inštalovať prostredníctvom NuGet alebo stiahnuť balík z serverov Aspose. pre podrobné pokyny, pozri inštalácia .
- Nastaviť merané licencovanie pri aplikácii startup, aby sa zabránilo hodnotenie obmedzenia Metrické licencie .
Príklad: Rozpoznávanie faktúr
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Funkcie a funkcie
Invozy špecifické OCR motory
- Prispôsobené rozpoznávacie modely pre tlačené a fotografované faktúry.
- Vysoká tolerancia pre rôzne rozlíšenia, hladiny hluku a šikovné uhly.
- Rozpoznávanie viacerých jazykov a digitálnych štýlov v rovnakom dokumente.
Prepracovanie a zdokonaľovanie obrazu
- Automatické odstraňovanie, odkladanie a binárne filtre na zlepšenie čitateľnosti.
- Adaptívna hranica, ktorá zachováva línie faktúry a tabuľkové hranice.
- Jasnosť a kontrastné úpravy na zvládnutie pod- alebo nadmerne vystavených skenov.
Analýza a detekcia tabuľky
- Automatická identifikácia hlavy, stĺpca, tabuľky položiek v riadku a súhrnných blokov.
- Rozpoznávanie riadkov, stĺpcov a buniek hraníc, aj keď sú riadiace línie slabé alebo chýbajú.
- Odstránenie nektovaných tabuliek (napr. podbodov pod prvkom materského riadku).
Kľúčové hodnoty extrakcie párov
- Konfigurovateľné šablóny do názvov poľa mapy (napr. „Číslo faktúry“, „Total Due“) do výsledkov OCR.
- Podpora dynamických štítkov – detekuje blízkosť textu namiesto prísneho šablóny.
- Dôverné skóre podľa poľa, ktoré vám umožňujú filtrovať alebo reprodukovať položky s nízkou dôverou.
Vývoz a integrácia
- Výstupné formáty: plochý text, JSON, XML, PDF, Word alebo HTML.
- Výsledky OCR sa pred serializáciou vyskytujú.
- Podpora spracovania batchov s kontrolami paralelizmu pre vysokorýchlostné pracovné zaťaženie.
Chyby spracovania a logovania
- Podrobné správy o výnimke pre bežné režimy zlyhania (napr. nepodporovaný formát obrazu, problémy s licenciou).
- Vstavaný logovací rozhranie kompatibilné s populárnymi logovacích rámov .NET (Serilog, NLog a log4net).
- Odstrániť politiky pre prechodné chyby počas I/O súboru alebo pridelenia pamäte.
Tipy a najlepšie postupy
- Prevalidovaná rozlíšenie obrazu: pre najlepšiu presnosť OCR, dodajte obrázky na alebo nad 300 DPI.
- Použite šedé alebo farebné obrázky - iba binárne vstupy môžu stratiť jemné tabuľkové línie.
- Umiestnite dôverné hranice podľa kvality vašich údajov; nižšie limity zachytávajú viac údajov, ale môžu vyžadovať dolný prúd validácie.
- Pre veľmi veľké balíky monitorujte používanie pamäte a prispôsobte paralelnosť pomocou možností spracovania plug-inu.
- Odstráňte funkciu šablóny kľúčových hodnôt, aby ste zmrazili očakávané rozloženia faktúry; pre neznáme rozlohy sa vrátia na generickú detekciu tabuľky.
- Vždy začať Metred Licensing pred vyvolaním akýchkoľvek OCR metód, aby sa zabránilo hodnotenie-mode vodné značky.
S dodržiavaním týchto usmernení a využitím svojich fakturačných schopností vám Aspose.OCR Invoice to Text for .NET umožňuje vytvoriť spoľahlivé, koncovo-koncentrované potrubia na spracovanie dokumentov – minimalizovať manuálne úsilie a maximalizáciu priepadu.