ASPOSE.OCR Lasku tekstiin .NET

Aspose.OCR Invoice to Text for .NET on erikoistunut plug-in, joka on suunniteltu yksinkertaistamaan strukturoidun tekstin poistoa skannatuista tai kuvattuista laskuista. Automaattamalla avainvaiheet – kuvan ennakkoprosessointi, järjestelyanalyysi ja OCR – voit tuottaa tuloksena olevia tietoja suoraan kirjanpitojärjestelmään, tietokantoihin tai maksuvälineisiin ilman manuaalista uudelleenmuodostusta. Plug-ini hyödyntää samaa laadukasta OCC: n ydinä kuin Aspos.ocR, optimoitu laskun asetuksia, taulukoita ja keskeisiä arvopareita varten. Voit vähentää käsittelyaikaa, minimoida ihmisen virheen ja saada johdonmukaisia ja tarkkoja tuloksia mittakaavassa.

Asennus ja asennus

Noudata näitä toimenpiteitä lisätäksesi Aspose.OCR Invoice tekstiin .NET projektillesi:

  • Asentaa NuGetin kautta tai ladata paketti Asposen palvelimilta. yksityiskohtaiset ohjeet, katso asennuksen .
  • Aseta mitattu lisenssi sovelluksen käynnistyspaikalla arviointirajoitusten välttämiseksi mitattu lisenssi .

Esimerkki: Laskujen tunnistaminen

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Ominaisuudet ja toiminnot

OCR-moottorin tilinpäätös

  • Yksityiskohtaiset tunnistamallit tulostettujen ja valokuvien laskujen osalta.
  • Korkea suvaitsevaisuus erilaisiin resoluutioihin, melun tasoihin ja hehkuihin kulmiin.
  • Useiden kielten tunnustaminen ja digitaaliset tyylit samassa asiakirjassa.

Kuvien käsittely ja parantaminen

  • Automaattiset puristukset, puristus ja binaryttiset suodattimet parantavat lukutaitoa.
  • Adaptiivinen kynnysarvo, joka säilyttää laskutuslinjat ja taulukon rajat.
  • Valon ja kontrastin sopeutuminen alhaisten tai yli altistuneiden skannausten käsittelyyn.

Layout-analyysi ja taulukon havaitseminen

  • Automaattinen tunnistaminen otsikko, footer, linjan kohteita taulukko, ja yhteenveto lohkot.
  • Tiivisteiden, sarakkeiden ja solun rajojen tunnistaminen, vaikka ohjauslinjat ovat heikkoja tai puutteellisia.
  • Nostettujen taulukoiden poisto (esim. alaluetta alkuperäisen linjan alapuolella).

Pääarvo Pair Extraction

  • Määritettävät mallit kartan kenttänimille (esim. ”Rahanumero”, ”Total Due”) OCR-tuloksiin.
  • Dynaamisen merkinnän tuki - havaitsee tekstin läheisyyden sijasta tiukkaa mallien vastaamista.
  • Luottamuspisteet kenttää kohden, jolloin voit suodattaa tai toistaa alhaisen luottamuksen kohteita.

vienti ja integraatio

  • Lähtömuodot: tasainen teksti, JSON, XML, PDF, Word tai HTML.
  • Tapahtumahäiriöt häiritsevät raaka OCR tuloksia ennen sarjakuvausta.
  • Batch-käsittelyn tuki parallelismikontrollien kanssa korkean volyymin työpaikkoja varten.

Virheiden käsittely ja kirjautuminen

  • Yksityiskohtaiset poikkeusviestit tavallisille epäonnistumismuodoille (esim. tukematon kuvanmuoto, lisensointiongelmat).
  • Sisäänrakennettu sisäänkirjautumisliittymä, joka on yhteensopiva suosittujen .NET-tiedostojen (Serilog, NLog ja log4net) kanssa).
  • Poista peräkkäisiä virheitä tiedoston I/O tai muistin erottamisen aikana.

Vinkkejä ja parhaita käytäntöjä

  • Ennalta validoitu kuvan resoluutio: parhaan OCR:n tarkkuuden saavuttamiseksi, kuvien toimitus 300 DPI:llä tai yli.
  • Käytä harmaata tai värillistä kuvaa – vain binary-tulokset voivat menettää hienoja pöytäkirjoja.
  • Suorita luottamukselliset kynnysarvot tietojesi laadun mukaan; pienemmät kynnet vievät enemmän tietoja, mutta saattavat vaatia alhaisen validoinnin.
  • Erittäin suurille kappaleille valvoa muistin käyttöä ja säätää rinnakkaisuutta plug-in-käsittelyvaihtoehdon kautta.
  • Levitä avain-arvon malli ominaisuus jäädyttämään odotetut laskun asetukset; tuntemattomille asetuksille palautuu geneerinen taulukon havaitseminen.
  • Aloita aina mitattu lisenssi ennen OCR-menetelmien käyttöönottoa, jotta vältetään arviointimenetelmät.

Noudattamalla näitä suuntaviivoja ja hyödyntämällä sen laskentakeskustannuksia, Aspose.OCR Invoice to Text for .NET antaa sinulle mahdollisuuden rakentaa luotettavia, lopullisia asiakirjojen käsittelyn putkia – minimoimalla manuaalinen ponnistelu ja maksimoimaan läpimurto.

 Suomi