Aspose.OCR račun za tekst za .NET
Aspose.OCR Invoice to Text za .NET je specijalizirani plug-in dizajniran za uklanjanje strukturiranog teksta iz skeniranih ili fotografiranih računa. Automatiziranjem ključnih koraka – preprocesiranje slike, analiza rasporeda i OCR – možete pohraniti rezultate podataka izravno u računovodstvene sustave, baze podataka ili platforme bez ručnog ponovnog tipiranja. Plug-ins isporučuje istu visoku kvalitetu središta oCR kao i Asposa.ocR, optimizirani za raspored račune, tablice i ključne vrijednosti parova.
Instaliranje i postavljanje
Slijedite ove korake kako biste dodali Aspose.OCR Invoice u tekst za .NET vašem projektu:
- Instalirajte putem NuGeta ili preuzmite paket s servera Aspose. za detaljne upute, pogledajte instalacija .
- Konfigurirajte mjerenu licenciranje na podizanju zahtjeva kako biste izbjegli ograničenja ocjenjivanja Mjerena dozvola .
Primjer: Prepoznavanje računa
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Značajke i funkcionalnosti
Specifični OCR motori
- Prilagođeni modeli prepoznavanja za tiskane i fotografirane račune.
- Visoka tolerancija za različite rezolucije, razine buke i šljunčane kutove.
- Priznavanje više jezika i digitalnih stilova u istom dokumentu.
Preprocesiranje i poboljšanje slike
- Automatski filtri za odlaganje, otklanjanje i binarizaciju poboljšavaju čitljivost.
- Adaptivna granica koja čuva granice računa i tablice.
- Jasnost i kontrast prilagodbe za rješavanje pod- ili previše izložene skeniranja.
Analiza rasporeda i detekcija tablice
- Automatsko identifikacija naslovnika, stopala, tabele linija predmeta i sažetak blokova.
- Prepoznavanje redova, kolona i granica stanica, čak i kada su vladajuće linije slabe ili nedostaju.
- Uklanjanje nestanih tablica (na primjer, podizvodi ispod predmeta rodne linije).
Ključna vrijednost par ekstrakcija
- Konfigurirane predložke za imena polja na karti (na primjer, “Number računa”, “Total Due”) za OCR rezultate.
- Podrška za dinamične oznake – otkriva tekstnu blizinu umjesto strogog usklađivanja predloga.
- Ocjenjivanje povjerenja po polju, što vam omogućuje da filtrirate ili reprodukirajte predmete niskog poverenja.
Izvoz i integracija
- Izlazni formati: ravni tekst, JSON, XML, PDF, Word ili HTML.
- Dogodak hoke za intercepciju sirovih rezultata OCR-a prije serializiranja.
- Podrška za obradu batha s paralelnim kontrolama za visoke radne opterećenja.
Pogreška upravljanja i prijavljivanja
- Detaljni iznimni poruke za uobičajene načine neuspjeha (npr. ne podržani format slike, problemi licenciranja).
- Ugrađeni logging interfejs kompatibilan s popularnim .NET loging okvirima (Serilog, NLog i log4net).
- Povratak politika za prijelazne pogreške tijekom datoteke I/O ili dodjele memorije.
Savjeti i najbolje prakse
- Prevalidirana rezolucija slike: za najbolju točnost OCR-a, isporučite slike na ili iznad 300 DPI.
- Koristite smeđe ili boje slike – samo binarne ulaznice mogu izgubiti lijepe stolne linije.
- Postavite ograničenja povjerenja u skladu s kvalitetom vaših podataka; niže granice uhvaćaju više podataka, ali mogu zahtijevati validaciju dolje.
- Za vrlo velike pakete, pratite upotrebu memorije i prilagodite paralelnost putem opcija obrade plug-ina.
- Uklonite funkciju predloga ključne vrijednosti kako biste zamrzli očekivane raspored računa; za nepoznate rasporede, vratite se na generičko otkrivanje tablice.
- Uvijek inicijalizirajte Mjereni licenciranje prije pozivanja na bilo kakve metode OCR-a kako biste izbjegli ocjenjivačke vodene oznake.
Slijedom ovih smjernica i iskorištavanjem svojeg računa-centric kapaciteta, Aspose.OCR Invoice to Text for .NET omogućuje vam da izgradite pouzdane, end-to-end dokument-procesne cijevi – minimizirajući ručni napor i maksimalno proći put.