Aspose.OCR Fattura in Testo per .NET
Aspose.OCR Invoice to Text per .NET è un plug-in specializzato progettato per semplificare l’estrazione di testo strutturato dalle fatturazioni scansionate o fotografate. Automatizzando i passaggi chiave - pre-processamento dell’immagine, analisi del layout, e OCR - è possibile alimentare i dati risultanti direttamente nei sistemi contabili, database, o piattaforme di pagamento senza re-typing manuale. Il plugin fornisce lo stesso nucleo OCC di alta qualità come Asposa.ocR, ottimizzato per le impostazioni della fattura, tabelle e coppie di valori chiavi. Riduce il tempo di elaborazione, minimizza gli errori umani e guadagna risultati coerenti e accurati a scala.
Installazione e Setup
Seguite questi passaggi per aggiungere Aspose.OCR Invoice al testo per .NET al vostro progetto:
- Installare tramite NuGet o scaricare il pacchetto dai server di Aspose. per istruzioni dettagliate, vedere Installazione .
- Configurare la licenza misurata all’applicazione startup per evitare limitazioni di valutazione Licenza a consumo .
Esempio: Riconoscimento delle fatturazioni
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Caratteristiche e funzionalità
Il motore specifico OCR
- Modelli di riconoscimento personalizzati per le fatturazioni stampate e fotografate.
- Alta tolleranza per varie risoluzioni, livelli di rumore e angoli scudo.
- Riconoscimento di più lingue e stili digitali nello stesso documento.
Immagini di Preprocessing & Enhancement
- I filtri di decavamento automatico, decapito e binarizzazione per migliorare la leggibilità.
- Il limite adattivo che conserva le linee di fatturazione e i confini della tabella.
- Correzioni di luminosità e contrasto per gestire scansioni sottostante o eccessivamente esposte.
Analisi del layout e rilevamento della tabella
- Identificazione automatica del titolo, del footer, della tabella degli articoli di linea e dei blocchi di sintesi.
- Riconoscimento di righe, colonne e confini cellulari, anche quando le linee di controllo sono deboli o mancanti.
- Estrazione di tabelle nestate (ad esempio, sottotitoli sotto un elemento della linea madre).
Valore chiave extrazione di coppia
- Modelli configurabili per i nomi dei campi di mappa (ad esempio, “Numero di fatturato”, “Total Due”) ai risultati OCR.
- Supporto per le etichette dinamiche - rileva la vicinanza del testo piuttosto che corrispondere strettamente al modello.
- Il punteggio di fiducia per campo, che consente di filtrare o riprodurre oggetti di bassa affidabilità.
Esportazione e integrazione
- Formati di uscita: testo piatto, JSON, XML, PDF, Word o HTML.
- L’evento è in grado di interferire con i risultati OCR prima della serializzazione.
- Supporto per la lavorazione di batch con controlli di parallelismo per carico di lavoro ad alto volume.
Trattamento errore e logging
- messaggi di eccezione dettagliati per i modi comuni di fallimento (ad esempio, formato immagine non supportato, problemi di licenza).
- Interfaccia di registrazione integrata compatibile con i popolari framework di log .NET (Serilog, NLog e log4net).
- Rimuovere le politiche per errori transitorie durante l’allocazione del file I/O o della memoria.
Suggerimenti e migliori pratiche
- Risoluzione immagine pre-validata: per la migliore precisione OCR, fornire immagini a o superiori a 300 DPI.
- Utilizzare immagini grigie o colorate – entrate binarie possono perdere linee di tavolo fine.
- Tune i limiti di fiducia in base alla qualità dei tuoi dati; i limite più bassi catturano più dati ma potrebbero richiedere la validazione a basso flusso.
- Per i pacchetti molto grandi, monitorare l’uso della memoria e regolare il parallelismo attraverso le opzioni di elaborazione del plug-in.
- Rimuovere la funzione del modello di valore chiave per congelare le pianificazioni di fatturazione attese; per i disegni sconosciuti, ritorna alla rilevazione della tabella generica.
- Iniziare sempre la Licenza Metrata prima di invocare qualsiasi metodo OCR per evitare i marchi d’acqua di valutazione-mode.
Seguendo queste linee guida e sfruttando le sue capacità di fatturazione-centrica, Aspose.OCR Invoice to Text per .NET ti consente di costruire affidabili, fin-to-end pipelines di elaborazione dei documenti – riducendo al minimo lo sforzo manuale e massimizzando il passaggio.