Převeďte následující text: Aspose.OCR Faktura na text pro .NET
Aspose.OCR Invoice to Text for .NET je specializovaný plug-in navržen tak, aby usnadnil extrahování strukturovaného textu z skenovaných nebo fotografovaných faktur. Automatizováním klíčových kroků – předběžné zpracování obrazu, analýza uspořádání a OCR – můžete nakládat s výslednými daty přímo do účetních systémů, databází nebo platebních platform bez manuálního re-typingu.
Instalace a nastavení
Postupujte podle následujících kroků, abyste do vašeho projektu přidali Aspose.OCR Invoice do textu pro .NET:
- Instalovat prostřednictvím NuGet nebo stáhnout balíček z serverů Aspose. pro podrobné pokyny, viz Instalace .
- Nastavení měřené licence na start-up aplikace, aby se zabránilo omezení hodnocení Licencování na bázi měření .
Příklad: Rozpoznávání faktur
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Funkce a funkce
Speciální motor OCR
- Přizpůsobené uznávací modely pro vytisknuté a fotografované faktury.
- Vysoká tolerance pro různé rozlišení, hladiny hluku a šikmých úhlů.
- Rozpoznávání několika jazyků a digitálních stylů ve stejném dokumentu.
Předběžné zpracování a zdokonalování obrazu
- Automatické filtry pro odklínání, odblokování a binaryzace pro zlepšení čitelnosti.
- Adaptivní hranici, která zachovává hranice faktur a tabulek.
- Jasnost a kontrastní úpravy pro nakládání s pod- nebo nadměrně vystavenými skenováním.
Analýza a detekce tabulky
- Automatická identifikace názvu, stopy, tabulky řádkových položek a souhrnných bloků.
- Rozpoznávání řádků, sloupců a buněčných hranic, a to i v případě, že řídící linie jsou slabé nebo chybí.
- Odstranění nátěrových tabulek (např. podbodů pod položkou mateřské čáry).
Klíčová hodnota dvojí extrakce
- Konfigurovatelné šablony pro názvy polí na mapě (např. „Číslo faktury“, „Total Due“) pro výsledky OCR.
- Podpora dynamických štítků – detekuje blízkost textu namísto přísného shromažďování šablony.
- Získání důvěry podle pole, které vám umožní filtrovat nebo reprodukovat položky s nízkým důverem.
Vývoz a integrace
- Výstupní formáty: plochý text, JSON, XML, PDF, Word nebo HTML.
- Výsledky OCR se před serializací přerušují.
- Podpora zpracování batchů s paralelistickými kontrolami pro vysokorychlostní pracovní zatížení.
Řešení chyb a přihlášení
- Podrobné výjimkové zprávy pro běžné režimy selhání (např. nepodporovaný formát obrazu, problémy s licencí).
- Vestavěný přihlašovací rozhraní kompatibilní s populárními logovacími rámy .NET (Serilog, NLog a log4net).
- Odstranění politik pro přechodné chyby během přidělování souboru I/O nebo paměti.
Tipy a nejlepší postupy
- Pre-validované rozlišení obrazu: pro nejlepší přesnost OCR, přinášejte obrázky na nebo nad 300 DPI.
- Použijte šedé nebo barevné obrázky – pouze binární vstupy mohou ztratit jemné tabulkové linie.
- Tune důvěryhodné prahové hodnoty podle kvality vašich údajů; nižší prahy zachytí více údajů, ale může vyžadovat dolní validace.
- Pro velmi velké balíčky monitorujte používání paměti a nastavíte paralelitu prostřednictvím možností zpracování pluginu.
- Odstraňte funkci šablonu klíčové hodnoty, abyste zmrazili očekávané rozložení faktury; pro neznámé uspořádání se dostanete zpět na generickou detekci tabulky.
- Vždy zahájit měřené licence před odvoláním na jakékoli metody OCR, aby se zabránilo hodnocení režimu vodních znaků.
Sledováním těchto pokynů a využíváním svých schopností zaměřených na fakturaci vám Aspose.OCR Invoice to Text for .NET umožňuje vytvářet spolehlivé potrubí pro zpracování dokumentů – minimalizovat manuální úsilí a maximalizace průtoků.