Aspose.OCR Τιμολόγιο σε Κείμενο για το .NET

Το Aspose.OCR Invoice to Text for .NET είναι ένα εξειδικευμένο plug-in που έχει σχεδιαστεί για να απλοποιήσει την εξόρυξη του δομημένου κειμένου από τις σαρωμένες ή φωτογραφημένες τιμολογίες. Με την αυτοματοποίηση των βασικών βημάτων - προ-απεξεργασία εικόνας, ανάλυση διάταξης, και OCR - μπορείτε να αποθηκεύσετε τα αποτελέσματα δεδομένων απευθείας σε λογιστικά συστήματα, βάσεις δεδομένα, ή πλατφόρμες πληρωμών χωρίς χειροκίνητη επαναπροσδιορισμό. Το plugin προσφέρει τον ίδιο υψηλής ποιότητας πυρήνα OCCR όπως το Asposa.ocR, βελτιστοποιημένο για τις διατάξεις τιμών, πίνακες και ζευγάρια βασικής αξίας. Θα μειώσει τον χρόνο επεξε.

Εισαγωγή και εγκατάσταση

Ακολουθήστε αυτά τα βήματα για να προσθέσετε το Aspose.OCR Invoice στο κείμενο για .NET στο έργο σας:

  • Εγκαταστήστε μέσω NuGet ή κατεβάστε το πακέτο από τους διακομιστές Aspose. για λεπτομερείς οδηγίες, δείτε התקנה .
  • Ρυθμίστε τη μετρημένη άδεια στην εκκίνηση εφαρμογών για να αποφύγετε περιορισμούς αξιολόγησης רישוי מדוד .

Παράδειγμα: Αναγνώριση τιμολογίων

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Χαρακτηριστικά και λειτουργίες

Φορολογικός ειδικός κινητήρας OCR

  • Προσαρμοσμένα μοντέλα αναγνώρισης για εκτυπωμένες και φωτογραφισμένες τιμολογίες.
  • Υψηλή ανοχή σε διαφορετικές επιδόσεις, επίπεδα θορύβου και γωνίες σπασμού.
  • Αναγνώριση πολλαπλών γλωσσών και ψηφιακών στυλ στο ίδιο έγγραφο.

Προεπεξεργασία και βελτίωση εικόνας

  • Αυτοματοποιημένα φίλτρα αποσυναρμολόγησης, απόσβεσης και δυαδικότητας για τη βελτίωση της νοημοσύνης.
  • Προσαρμοστικό όριο που διατηρεί τις γραμμές τιμολόγησης και τα όρια του πίνακα.
  • Προσαρμογές φωτεινότητας και αντίθεσης για την αντιμετώπιση υπο- ή υπερ-εκτεθειμένων σάρωσης.

Ανάλυση και ανίχνευση πίνακα

  • Αυτόματη ταυτοποίηση του επικεφαλής, του πεζοδρόμου, της γραμμής του πίνακα στοιχείων και των συνοπτικών μπλοκ.
  • Αναγνώριση των γραμμών, των στήλων και των κυτταρικών ορίων, ακόμη και όταν οι κυριαρχικές γραμμές είναι αδύναμες ή λείπουν.
  • Εξαγωγή κατεστραμμένων τραπεζών (π.χ. υπο-ειδικά στοιχεία κάτω από ένα στοιχείο της μητρικής γραμμής).

Σημαντικό ζευγάρι εξόρυξης

  • Μπορείτε να ρυθμίσετε πρότυπα για τα ονόματα πεδίου χάρτη (π.χ. «Αριθμός τιμολογίου», «Total Due») στα αποτελέσματα OCR.
  • Υποστήριξη για δυναμικές – ανιχνεύει την εγγύτητα του κειμένου αντί να ταιριάζει με αυστηρά πρότυπα.
  • Αξιολόγηση εμπιστοσύνης ανά πεδίο, επιτρέποντάς σας να φιλτράρετε ή να αναπαράγετε αντικείμενα χαμηλής αξιοπιστίας.

Εξαγωγή & Ενσωμάτωση

  • Οι μορφές εξόδου: κείμενο, JSON, XML, PDF, Word ή HTML.
  • Τα γεγονότα διακόπτουν τα πρώτα αποτελέσματα του OCR πριν από τη σειρά.
  • Υποστήριξη επεξεργασίας συσκευών με παράλληλους ελέγχους για φορτία εργασίας υψηλού όγκου.

Λάθος επεξεργασίας και εγγραφής

  • Λεπτομερή μηνύματα εξαίρεσης για τις κοινές λειτουργίες αποτυχίας (π.χ. μη υποστηριζόμενη μορφή εικόνας, προβλήματα αδειοδότησης).
  • Η ενσωματωμένη διεπαφή καταγραφής είναι συμβατή με τα δημοφιλή πλαίσια .NET (Serilog, NLog και log4net).
  • Πολιτικές ανάκλησης για μεταβατικά σφάλματα κατά τη διάρκεια του αρχείου I/O ή της κατανομής μνήμης.

Συμβουλές και καλύτερες πρακτικές

  • Προεπιβεβαιωμένη ανάλυση εικόνας: για την καλύτερη ακρίβεια OCR, παρέχονται εικόνες σε ή πάνω από 300 DPI.
  • Χρησιμοποιήστε γκρίζες ή χρωματικές εικόνες - μόνο δυαδικές εισαγωγές μπορεί να χάσουν λεπτές γραμμές του τραπεζιού.
  • Κάντε τα όρια εμπιστοσύνης ανάλογα με την ποιότητα των δεδομένων σας. τα χαμηλότερα όριά συλλέγουν περισσότερα δεδομένα, αλλά ενδέχεται να απαιτούν επικύρωση προς τα κάτω.
  • Για πολύ μεγάλες συσκευές, παρακολουθήστε τη χρήση μνήμης και προσαρμόστε το παράλληλο μέσω των επιλογών επεξεργασίας του plug-in.
  • Κατεβάστε τη λειτουργία πρότυπου κλειδιά-αξία για να παγώσετε τις αναμενόμενες διατάξεις τιμολογίου. για άγνωστες διαταγές, πέφτει πίσω στην γενική ανίχνευση του πίνακα.
  • Πάντα ξεκινήστε μετρημένη άδεια πριν ανακαλύψετε οποιαδήποτε μέθοδοι OCR για να αποφύγετε την αξιολόγηση-μεθόδους σημεία νερού.

Ακολουθώντας αυτές τις κατευθυντήριες γραμμές και αξιοποιώντας τις ικανότητές του για λογαριασμό, Aspose.OCR Invoice to Text for .NET σας επιτρέπει να δημιουργήσετε αξιόπιστα, τελικό-σε-τέλος σωλήνες επεξεργασίας εγγράφων – ελαχιστοποιώντας την εγχειρητική προσπάθεια και μεγιστοποίηση της διαρροής.

 Ελληνικά