Aspose.OCR faktúra na text pre .NET

Aspose.OCR Invoice to Text for .NET je špecializovaný plug-in navrhnutý tak, aby zjednodušil extrakciu štruktúrovaného textu z skenovaných alebo fotografovaných faktúr. Automatizáciou kľúčových krokov – predbežného spracovania obrazu, analýzy rozloženia a OCR – môžete kŕmiť výsledné údaje priamo do účtovných systémov, databáz alebo platobných platforiem bez manuálneho re-typingu.

Inštalácia a nastavenie

Postupujte podľa týchto krokov, aby ste do vášho projektu pridali Aspose.OCR Invoice do textu pre .NET:

  • Inštalovať prostredníctvom NuGet alebo stiahnuť balík z serverov Aspose. pre podrobné pokyny, pozri inštalácia .
  • Nastaviť merané licencovanie pri aplikácii startup, aby sa zabránilo hodnotenie obmedzenia Metrické licencie .

Príklad: Rozpoznávanie faktúr

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Funkcie a funkcie

Invozy špecifické OCR motory

  • Prispôsobené rozpoznávacie modely pre tlačené a fotografované faktúry.
  • Vysoká tolerancia pre rôzne rozlíšenia, hladiny hluku a šikovné uhly.
  • Rozpoznávanie viacerých jazykov a digitálnych štýlov v rovnakom dokumente.

Prepracovanie a zdokonaľovanie obrazu

  • Automatické odstraňovanie, odkladanie a binárne filtre na zlepšenie čitateľnosti.
  • Adaptívna hranica, ktorá zachováva línie faktúry a tabuľkové hranice.
  • Jasnosť a kontrastné úpravy na zvládnutie pod- alebo nadmerne vystavených skenov.

Analýza a detekcia tabuľky

  • Automatická identifikácia hlavy, stĺpca, tabuľky položiek v riadku a súhrnných blokov.
  • Rozpoznávanie riadkov, stĺpcov a buniek hraníc, aj keď sú riadiace línie slabé alebo chýbajú.
  • Odstránenie nektovaných tabuliek (napr. podbodov pod prvkom materského riadku).

Kľúčové hodnoty extrakcie párov

  • Konfigurovateľné šablóny do názvov poľa mapy (napr. „Číslo faktúry“, „Total Due“) do výsledkov OCR.
  • Podpora dynamických štítkov – detekuje blízkosť textu namiesto prísneho šablóny.
  • Dôverné skóre podľa poľa, ktoré vám umožňujú filtrovať alebo reprodukovať položky s nízkou dôverou.

Vývoz a integrácia

  • Výstupné formáty: plochý text, JSON, XML, PDF, Word alebo HTML.
  • Výsledky OCR sa pred serializáciou vyskytujú.
  • Podpora spracovania batchov s kontrolami paralelizmu pre vysokorýchlostné pracovné zaťaženie.

Chyby spracovania a logovania

  • Podrobné správy o výnimke pre bežné režimy zlyhania (napr. nepodporovaný formát obrazu, problémy s licenciou).
  • Vstavaný logovací rozhranie kompatibilné s populárnymi logovacích rámov .NET (Serilog, NLog a log4net).
  • Odstrániť politiky pre prechodné chyby počas I/O súboru alebo pridelenia pamäte.

Tipy a najlepšie postupy

  • Prevalidovaná rozlíšenie obrazu: pre najlepšiu presnosť OCR, dodajte obrázky na alebo nad 300 DPI.
  • Použite šedé alebo farebné obrázky - iba binárne vstupy môžu stratiť jemné tabuľkové línie.
  • Umiestnite dôverné hranice podľa kvality vašich údajov; nižšie limity zachytávajú viac údajov, ale môžu vyžadovať dolný prúd validácie.
  • Pre veľmi veľké balíky monitorujte používanie pamäte a prispôsobte paralelnosť pomocou možností spracovania plug-inu.
  • Odstráňte funkciu šablóny kľúčových hodnôt, aby ste zmrazili očakávané rozloženia faktúry; pre neznáme rozlohy sa vrátia na generickú detekciu tabuľky.
  • Vždy začať Metred Licensing pred vyvolaním akýchkoľvek OCR metód, aby sa zabránilo hodnotenie-mode vodné značky.

S dodržiavaním týchto usmernení a využitím svojich fakturačných schopností vám Aspose.OCR Invoice to Text for .NET umožňuje vytvoriť spoľahlivé, koncovo-koncentrované potrubia na spracovanie dokumentov – minimalizovať manuálne úsilie a maximalizáciu priepadu.

 Slovenčina