Aspose.OCR Fattura in Testo per .NET

Aspose.OCR Invoice to Text per .NET è un plug-in specializzato progettato per semplificare l’estrazione di testo strutturato dalle fatturazioni scansionate o fotografate. Automatizzando i passaggi chiave - pre-processamento dell’immagine, analisi del layout, e OCR - è possibile alimentare i dati risultanti direttamente nei sistemi contabili, database, o piattaforme di pagamento senza re-typing manuale. Il plugin fornisce lo stesso nucleo OCC di alta qualità come Asposa.ocR, ottimizzato per le impostazioni della fattura, tabelle e coppie di valori chiavi. Riduce il tempo di elaborazione, minimizza gli errori umani e guadagna risultati coerenti e accurati a scala.

Installazione e Setup

Seguite questi passaggi per aggiungere Aspose.OCR Invoice al testo per .NET al vostro progetto:

  • Installare tramite NuGet o scaricare il pacchetto dai server di Aspose. per istruzioni dettagliate, vedere Installazione .
  • Configurare la licenza misurata all’applicazione startup per evitare limitazioni di valutazione Licenza a consumo .

Esempio: Riconoscimento delle fatturazioni

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Caratteristiche e funzionalità

Il motore specifico OCR

  • Modelli di riconoscimento personalizzati per le fatturazioni stampate e fotografate.
  • Alta tolleranza per varie risoluzioni, livelli di rumore e angoli scudo.
  • Riconoscimento di più lingue e stili digitali nello stesso documento.

Immagini di Preprocessing & Enhancement

  • I filtri di decavamento automatico, decapito e binarizzazione per migliorare la leggibilità.
  • Il limite adattivo che conserva le linee di fatturazione e i confini della tabella.
  • Correzioni di luminosità e contrasto per gestire scansioni sottostante o eccessivamente esposte.

Analisi del layout e rilevamento della tabella

  • Identificazione automatica del titolo, del footer, della tabella degli articoli di linea e dei blocchi di sintesi.
  • Riconoscimento di righe, colonne e confini cellulari, anche quando le linee di controllo sono deboli o mancanti.
  • Estrazione di tabelle nestate (ad esempio, sottotitoli sotto un elemento della linea madre).

Valore chiave extrazione di coppia

  • Modelli configurabili per i nomi dei campi di mappa (ad esempio, “Numero di fatturato”, “Total Due”) ai risultati OCR.
  • Supporto per le etichette dinamiche - rileva la vicinanza del testo piuttosto che corrispondere strettamente al modello.
  • Il punteggio di fiducia per campo, che consente di filtrare o riprodurre oggetti di bassa affidabilità.

Esportazione e integrazione

  • Formati di uscita: testo piatto, JSON, XML, PDF, Word o HTML.
  • L’evento è in grado di interferire con i risultati OCR prima della serializzazione.
  • Supporto per la lavorazione di batch con controlli di parallelismo per carico di lavoro ad alto volume.

Trattamento errore e logging

  • messaggi di eccezione dettagliati per i modi comuni di fallimento (ad esempio, formato immagine non supportato, problemi di licenza).
  • Interfaccia di registrazione integrata compatibile con i popolari framework di log .NET (Serilog, NLog e log4net).
  • Rimuovere le politiche per errori transitorie durante l’allocazione del file I/O o della memoria.

Suggerimenti e migliori pratiche

  • Risoluzione immagine pre-validata: per la migliore precisione OCR, fornire immagini a o superiori a 300 DPI.
  • Utilizzare immagini grigie o colorate – entrate binarie possono perdere linee di tavolo fine.
  • Tune i limiti di fiducia in base alla qualità dei tuoi dati; i limite più bassi catturano più dati ma potrebbero richiedere la validazione a basso flusso.
  • Per i pacchetti molto grandi, monitorare l’uso della memoria e regolare il parallelismo attraverso le opzioni di elaborazione del plug-in.
  • Rimuovere la funzione del modello di valore chiave per congelare le pianificazioni di fatturazione attese; per i disegni sconosciuti, ritorna alla rilevazione della tabella generica.
  • Iniziare sempre la Licenza Metrata prima di invocare qualsiasi metodo OCR per evitare i marchi d’acqua di valutazione-mode.

Seguendo queste linee guida e sfruttando le sue capacità di fatturazione-centrica, Aspose.OCR Invoice to Text per .NET ti consente di costruire affidabili, fin-to-end pipelines di elaborazione dei documenti – riducendo al minimo lo sforzo manuale e massimizzando il passaggio.

 Italiano