Aspose.OCR Rechnung zu Text für .NET

Aspose.OCR Invoice to Text for .NET ist ein spezialisiertes Plug-in, das die Extraction von strukturierten Text aus scannen oder fotografierten Rechnungen vereinfacht. Durch die Automatisierung der Schlüsselschritte – Bildvorverarbeitung, Layout-Analyse und OCR – können Sie die resultierenden Daten direkt in Rechnungslegungssysteme, Datenbanken oder Zahlungsplattformen ohne manuelle Re-Typing versorgen. Die Plugg-In liefert die gleiche hochwertige OCC-Kern wie Asposa.ocR, optimiert für Rechnungslayouts, Tabellen und Schriftwertpaare. Sie reduzieren die Verarbeitungstunden, minimieren menschliche Fehler und erzielen konsistente, genaue Ergebnisse auf der Skala.

Installation und Setup

Folgen Sie diesen Schritten, um Aspose.OCR Invoice in Text für .NET zu Ihrem Projekt hinzuzufügen:

  • Installieren Sie über NuGet oder herunterladen Sie das Paket von Aspose-Server Installation .
  • Konfigurieren Sie die gemessene Lizenzierung bei Application Startup, um Einschränkungen der Bewertung zu vermeiden Metered Licensing .

Beispiel: Anerkennung von Rechnungen

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Eigenschaften und Funktionen

Rechnungsspezifischer OCR-Motor

  • Anpassungsmodelle für gedruckte und fotografierte Rechnungen.
  • Hohe Toleranz für unterschiedliche Auflösungen, Geräuschniveaus und Schweißangeln.
  • Anerkennung von mehreren Sprachen und digitalen Stilen innerhalb des gleichen Dokuments.

Bildverarbeitung & Verbesserung

  • Automatische Deckung, Deckle und Binary-Filter zur Verbesserung der Lesbarkeit.
  • Adaptive Grenzwerte, die Rechnungslinien und Tischgrenzen bewahren.
  • Brightness und Kontrast-Anpassungen, um unter- oder über-exponierte Scans zu behandeln.

Layout Analyse & Tischdetektion

  • Automatische Identifizierung von Header, Footer, Line-Elemente-Tabelle und Zusammenfassungsblöcke.
  • Anerkennung von Zeilen, Spalten und Zellgrenzen, auch wenn die Leitlinien fehl sind oder fehlen.
  • Extraction von Nested Tables (z. B. Unterteile unter einem Element der Mutterlinie).

Schlüsselwert Pair Extraction

  • Configurable Templates to map field names (e.g., “Invoice Number”, “Total Due”) to OCR results.
  • Unterstützung für dynamische Etiketten – ermittelt die Text-Nachbarkeit anstatt strenge Template Matching.
  • Vertrauen Score per Feld, die es Ihnen ermöglicht, zu filtern oder zu reproduzieren Low-Confidence-Elemente.

Export & Integration

  • Ausgangsformate: klar Text, JSON, XML, PDF, Word oder HTML.
  • Event hooks, um Roh OCR Ergebnisse vor serialisierung zu interceptieren.
  • Batch-Verarbeitungsunterstützung mit Parallelismus-Kontrolle für hohe Arbeitsbelastungen.

Fehlerbehandlung & Logging

  • Detaillierte Ausnahmenachrichten für häufige Fehlermodes (z. B. nicht unterstütztes Bildformat, Lizenzprobleme).
  • Built-in-Logging-Interface kompatibel mit den beliebten .NET Logging Frameworks (Serilog, NLog und log4net).
  • Retry-Politiken für Übergangsfehler während der Datei I/O oder Speicherverteilung.

Tipps und Best Practices

  • Prävalidierte Bildresolution: Für eine optimale OCR-Genauigkeit liefern Sie Bilder bei oder über 300 DPI.
  • Verwenden Sie grausame oder farbige Bilder – nur binäre Einträge können feine Tischlinien verlieren.
  • Tune Vertrauensgrenzen nach Ihrer Datenqualität; niedrige Grenzen fangen mehr Daten ein, aber möglicherweise erfordert eine Downstream-Validierung.
  • Für sehr große Batches überwachen Sie die Speicherverwendung und regulieren Sie den Parallel über die Verarbeitungsoptionen des Plug-ins.
  • Laden Sie die Schlüssel-Wert-Template-Funktion ab, um die erwarteten Rechnungslegungen zu freiziehen; für unbekannte Layouts fallen Sie zurück auf die generische Tabelle-Detektion.
  • Initialisieren Sie immer Metered Licensing, bevor Sie alle OCR-Methoden anrufen, um die Wassermärkte der Bewertungsmodus zu vermeiden.

Durch die Einhaltung dieser Leitlinien und die Nutzung ihrer Rechnungszentrischen Kapazitäten ermöglicht es Ihnen, zuverlässige, end-to-end-Dokumentverarbeitungsanlagen zu bauen – manuelle Anstrengungen zu minimieren und den Durchgang zu maximieren.

 Deutsch