ASPOSE.OCR Rēķins uz tekstu .NET

Aspose.OCR Invoice to Text for .NET ir specializēts plug-in, kas izstrādāts, lai vienkāršotu strukturētā teksta ekstrakciju no skenēta vai fotografēta rēķina. Ar automātisku galveno soļu - attēla preprocessing, izkārtojuma analīzi un OCR - jūs varat piegādāt rezultātus tieši grāmatvedības sistēmām, datu bāzēm vai maksājumu platformām bez manuālās pārveides. Plug-ins izmanto to pašu augstas kvalitātes OCD kodolu kā Asposa.ocR, optimizēts rakstiem, tabulām un atslēgvārdu pāriem. Jūs samazināt apstrādes laiku, minimalizēt cilvēka kļūdu un iegūt konsekventu, precīzu rezultātu skalā.

Instalācija un uzstādīšana

Izpildiet šos soļus, lai pievienotu Aspose.OCR rēķinu tekstam .NET jūsu projektam:

  • Instalēt caur NuGet vai lejupielādēt iepakojumu no Aspose serveriem Installation .
  • Iestatīt mērenu licencēšanu pieteikuma startu, lai izvairītos no novērtēšanas ierobežojumiem Mērtēta licencēšana .

Piemērs: Rēķinu atzīšana

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Iezīmes un funkcionalitātes

Rēķinu specifiskais OCR motors

  • Atbilstoši atpazīšanas modeļi drukātajiem un fotografētajiem rēķiniem.
  • Augsta izturība pret atšķirīgām rezolūcijām, trokšņa līmeņiem un skumjām leņķēm.
  • Vairāku valodu un digitālo stilu atzīšana tajā pašā dokumentā.

Attēla priekšapstrāde un uzlabošana

  • Automātiski atšķaidīt, atšifrēt un binarizācijas filtrus, lai uzlabotu lasamību.
  • Adaptīvā robežvērtība, kas saglabā rēķinu līnijas un tabulas robežas.
  • Skaistums un kontrasta pielāgojumi, lai pārvaldītu zemas vai pārāk pakļautas skenēšanas.

Layout analīze un tabulas atklāšana

  • Automātiskā nosaukuma, kāpņu, līnijas priekšmetu tabulas un kopsavilkuma bloku identifikācija.
  • Sarakstu, slāņu un šūnu robežu atpazīšana, pat tad, ja dominējošās līnijas ir vājas vai trūkst.
  • Nestētu tabulu ekstrakcija (piemēram, apakšsaziņas punkti zem mātes līnijas punkta).

Galvenās vērtības pāris ekstrakcija

  • Konfigurējamas veidnes kartes lauka nosaukumiem (piemēram, “Faktūras numurs”, “Total Due”) OCR rezultātiem.
  • Atbalsts dinamiskām etiķetēm – tā atklāj teksta tuvumu, nevis stingru šablonu atbilstību.
  • Uzticības rādītāji pēc lauka, ļaujot filtrēt vai reproducēt zemo uzticību priekšmetus.

Eksports un integrācija

  • Izejas formāti: plašs teksts, JSON, XML, PDF, Word vai HTML.
  • Iespējams, ka pirms serializācijas iznāk OCR rezultāti.
  • Batch apstrādes atbalsts ar paralelisms kontroles augsta apjoma darba slodzes.

kļūdu apstrāde un reģistrācija

  • Detalizēti izņēmuma ziņojumi par kopīgiem neveiksmes režīmiem (piemēram, nepieņemts attēla formāts, licencēšanas problēmas).
  • Iebūvēts logēšanas saskarne, kas ir saderīga ar populārajām .NET logšanas struktūrām (Serilog, NLog un log4net).
  • Atgriezt politiku par pārejas kļūdām faila I/O vai atmiņas piešķiršanas laikā.

Padomi un labākās prakses

  • Pre-validēta attēla izšķirtspēja: par labāko OCR precizitāti, piegādā attēlus ar vai virs 300 DPI.
  • Izmantojiet grauskalu vai krāsu attēlus – tikai binārie ieejas var zaudēt labās tabulas līnijas.
  • Uzklājiet uzticības robežas atbilstoši jūsu datu kvalitātei; zemākie robežvērtības nokļūst vairāk datu, bet var prasīt lejupslīdes validāciju.
  • Ļoti lieliem kompleksiem novēro atmiņas izmantošanu un pielāgo paralēli, izmantojot plug-in apstrādes iespējas.
  • Uzlabojiet atslēgas vērtības veidnes funkciju, lai iesaldētu gaidītos rēķinu izkārtojumus; nezināmiem iestatījumiem atgriežas ģenētiskā tabulas detekcija.
  • Vienmēr uzsāciet Mērēto licencēšanu pirms jebkādu OCR metožu izmantošanas, lai izvairītos no novērtēšanas modeļa ūdensmarķējumiem.

Izmantojot šos pamatnostādnes un izmantojot tās rēķinu centrālās iespējas, Aspose.OCR Invoice to Text for .NET ļauj jums izveidot uzticamu, galu līdz galam dokumentu apstrādes cauruļvadu – samazinot manuālo pūliņu un maksimāli palielinot caurlaidību.

 Latviski