ASPOSE.OCR sąskaita į tekstą .NET
Aspose.OCR sąskaita į tekstą .NET yra specializuotas priedas, skirtas supaprastinti struktūrinio teksto ištraukimą iš skenuojamų ar nuotraukų faktūrų. Automatizuojant pagrindinius žingsnius - vaizdo išankstinį apdorojimą, tvarkymo analizę ir OCR - galite pateikti gautus duomenis tiesiogiai į apskaitos sistemas, duomenų bazes ar mokėjimo platformas be rankinio re-typingo. Priedai teikia tą patį aukštos kokybės OCR branduolį kaip Asposa.ocR, optimizuota sąrašo išdėstymo, lentelių ir pagrindinės vertės poroms. Jūs sumažinsite perdirbimo laiką, sumažinti žmogišką klaidą ir gausite nuoseklų, tikslų rezultatų skalėje.
Įdiegimas ir nustatymas
Toliau sekite šiuos žingsnius, kad jūsų projektui pridėtumėte Aspose.OCR sąskaitą į .NET tekstą:
- Įdiegti per NuGet arba atsisiųsti paketą iš Aspose serverių Installation .
- Nustatykite matuotą licenciją paraiškos pradžioje, kad išvengtumėte vertinimo apribojimų Išmatuota licencija .
Pavyzdys: sąskaitų pripažinimas
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Savybės ir funkcijos
Sąskaitos specifika OCR variklis
- Pritaikyti atpažinimo modeliai spausdintiems ir fotografuotiems sąskaitoms.
- Aukštas tolerancija skirtingoms rezoliucijoms, triukšmo lygiams ir sklandžiam kampui.
- Daugelio kalbų ir skaitmeninių stilių pripažinimas toje pačioje knygoje.
Vaizdo perdirbimas ir tobulinimas
- Automatiniai filtravimo, atsiskleidimo ir binarizacijos filtrai, siekiant pagerinti skaitomumą.
- Adaptyvi riba, kuri išsaugo sąskaitos linijas ir lentelių ribas.
- Ryškumas ir kontrastiniai koregavimai, skirti tvarkyti apatinius arba pernelyg eksponuotus skenus.
Layout analizė ir lentelės aptikimas
- Automatinis pavadinimo, pėdkelnės, eilutės elementų lentelės ir apibendrinimo blokų identifikavimas.
- Lentelių, stulpelių ir ląstelių ribų pripažinimas, net jei valdymo linijos yra silpnos arba trūksta.
- Nustotų lentelių (pavyzdžiui, sub elementų pagal motinos eilutės elementą) ištraukimas).
Pagrindinės vertės poros ekstrakcija
- Konfiguruojami šablonai žemėlapio lauko vardams (pvz., „Faktos numeris“, „Total Due“) į OCR rezultatus.
- Dinaminės etiketės palaikymas – nustato teksto artimumą, o ne griežtą šablonų atitikimą.
- Pasitikėjimo rezultatai pagal lauką, leidžiančius filtruoti arba atkurti mažo pasitikimo elementus.
Eksportas ir integracija
- Išėjimo formatus: plokščio teksto, JSON, XML, PDF, Word arba HTML.
- Renginiai sukelia žaliavų OCR rezultatus prieš serializavimą.
- Batch apdorojimo palaikymas su paralelizmo kontrolėmis didelės apimties darbo apkrovoms.
Klaidų tvarkymas ir registravimas
- Išsamios išimties žinutės, skirtos bendram nesėkmės režimui (pavyzdžiui, nepalaikytas vaizdo formatas, licencijavimo problemos).
- Įdiegta sąrašo sąsaja, suderinama su populiariais .NET sąrašų rėmeliais (Serilog, NLog ir log4net).
- Atsisiųsti politiką pereinamojo laikotarpio klaidų metu failų I/O arba atminties paskirstymo.
Patarimai ir geriausios praktikos
- Iš anksto patvirtinta vaizdo rezoliucija: už geriausią OCR tikslumą, pateikiami vaizdai 300 dpi arba didesni.
- Naudokite gražus arba spalvotus vaizdus – tik binariniai įvedimai gali prarasti subtilias lentelės linijas.
- Atkreipkite dėmesį į pasitikėjimo ribas pagal jūsų duomenų kokybę; žemesnės ribos užfiksuoja daugiau duomenų, bet gali reikalauti atnaujinimo patvirtinimo.
- Labai dideliems batams stebėkite atminties naudojimą ir pritaikykite paralelizmą per „plug-in“ apdorojimo galimybes.
- Atsisiųskite raktinės vertės šablonos funkciją, kad užšaldytumėte numatytus sąskaitos nustatymus; nežinomų nustatymų atveju grįžkite prie generinio lentelės aptikimo.
- Visada pradėkite „Metered Licensing“ prieš kreipdamiesi į bet kokius OCR metodus, kad išvengtumėte vertinimo režimo vandens ženklų.
Atsižvelgiant į šias gaires ir naudodamasis sąskaitos centralizuotais pajėgumais, „Aspose.OCR Invoice to Text for .NET“ leidžia jums sukurti patikimą, galutinį dokumentų apdorojimo vamzdį – sumažinti rankinius pastangas ir maksimaliai padidinti perteklius.