Aspose.OCR račun za tekst za .NET

Aspose.OCR Invoice to Text za .NET je specijalizirani plug-in dizajniran za uklanjanje strukturiranog teksta iz skeniranih ili fotografiranih računa. Automatiziranjem ključnih koraka – preprocesiranje slike, analiza rasporeda i OCR – možete pohraniti rezultate podataka izravno u računovodstvene sustave, baze podataka ili platforme bez ručnog ponovnog tipiranja. Plug-ins isporučuje istu visoku kvalitetu središta oCR kao i Asposa.ocR, optimizirani za raspored račune, tablice i ključne vrijednosti parova.

Instaliranje i postavljanje

Slijedite ove korake kako biste dodali Aspose.OCR Invoice u tekst za .NET vašem projektu:

  • Instalirajte putem NuGeta ili preuzmite paket s servera Aspose. za detaljne upute, pogledajte instalacija .
  • Konfigurirajte mjerenu licenciranje na podizanju zahtjeva kako biste izbjegli ograničenja ocjenjivanja Mjerena dozvola .

Primjer: Prepoznavanje računa

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Značajke i funkcionalnosti

Specifični OCR motori

  • Prilagođeni modeli prepoznavanja za tiskane i fotografirane račune.
  • Visoka tolerancija za različite rezolucije, razine buke i šljunčane kutove.
  • Priznavanje više jezika i digitalnih stilova u istom dokumentu.

Preprocesiranje i poboljšanje slike

  • Automatski filtri za odlaganje, otklanjanje i binarizaciju poboljšavaju čitljivost.
  • Adaptivna granica koja čuva granice računa i tablice.
  • Jasnost i kontrast prilagodbe za rješavanje pod- ili previše izložene skeniranja.

Analiza rasporeda i detekcija tablice

  • Automatsko identifikacija naslovnika, stopala, tabele linija predmeta i sažetak blokova.
  • Prepoznavanje redova, kolona i granica stanica, čak i kada su vladajuće linije slabe ili nedostaju.
  • Uklanjanje nestanih tablica (na primjer, podizvodi ispod predmeta rodne linije).

Ključna vrijednost par ekstrakcija

  • Konfigurirane predložke za imena polja na karti (na primjer, “Number računa”, “Total Due”) za OCR rezultate.
  • Podrška za dinamične oznake – otkriva tekstnu blizinu umjesto strogog usklađivanja predloga.
  • Ocjenjivanje povjerenja po polju, što vam omogućuje da filtrirate ili reprodukirajte predmete niskog poverenja.

Izvoz i integracija

  • Izlazni formati: ravni tekst, JSON, XML, PDF, Word ili HTML.
  • Dogodak hoke za intercepciju sirovih rezultata OCR-a prije serializiranja.
  • Podrška za obradu batha s paralelnim kontrolama za visoke radne opterećenja.

Pogreška upravljanja i prijavljivanja

  • Detaljni iznimni poruke za uobičajene načine neuspjeha (npr. ne podržani format slike, problemi licenciranja).
  • Ugrađeni logging interfejs kompatibilan s popularnim .NET loging okvirima (Serilog, NLog i log4net).
  • Povratak politika za prijelazne pogreške tijekom datoteke I/O ili dodjele memorije.

Savjeti i najbolje prakse

  • Prevalidirana rezolucija slike: za najbolju točnost OCR-a, isporučite slike na ili iznad 300 DPI.
  • Koristite smeđe ili boje slike – samo binarne ulaznice mogu izgubiti lijepe stolne linije.
  • Postavite ograničenja povjerenja u skladu s kvalitetom vaših podataka; niže granice uhvaćaju više podataka, ali mogu zahtijevati validaciju dolje.
  • Za vrlo velike pakete, pratite upotrebu memorije i prilagodite paralelnost putem opcija obrade plug-ina.
  • Uklonite funkciju predloga ključne vrijednosti kako biste zamrzli očekivane raspored računa; za nepoznate rasporede, vratite se na generičko otkrivanje tablice.
  • Uvijek inicijalizirajte Mjereni licenciranje prije pozivanja na bilo kakve metode OCR-a kako biste izbjegli ocjenjivačke vodene oznake.

Slijedom ovih smjernica i iskorištavanjem svojeg računa-centric kapaciteta, Aspose.OCR Invoice to Text for .NET omogućuje vam da izgradite pouzdane, end-to-end dokument-procesne cijevi – minimizirajući ručni napor i maksimalno proći put.

 Hrvatski