Μεταφράζοντας το κείμενο: Aspose.OCR Πίνακας σε Κείμενο για το .NET

Το Aspose.OCR Table to Text για .NET είναι ένα ισχυρό plug-in που επιτρέπει στους προγραμματιστές να εξάγουν κείμενο από σαρωμένα ή φωτογραφημένα τραπέζια με υψηλή ακρίβεια. Αποκάλυψη προηγμένων αλγόριθμων μηχανικής μάθησης και νευρικών δικτύων, ανιχνεύει δομές τραπεζών, τραβάει κείμενα σε επίπεδο κυττάρου, και οργανώνει τα πάντα σε αναζησιμότητα, επεξεργαστικά φύλλα ή δομών δεδομένων τραπεζίτη.

Εισαγωγή και εγκατάσταση

Για να ξεκινήσετε, εγκαταστήστε το πακέτο Aspose.OCR Table to Text μέσω του NuGet ή κατεβάστε τη συλλογή από τους διακομιστές του ASPOSE התקנה Οδηγός για λεπτομερείς βήματα.Επιτρέπει την πλήρη λειτουργικότητα με τη διαμόρφωση της μετρημένης άδειας όπως περιγράφεται στο רישוי מדוד Η τεκμηρίωση.

Χαρακτηριστικά και λειτουργίες

Πίνακας ανίχνευσης και αναγνώρισης δομών

  • Ανακαλύπτει αυτόματα τα όρια του πίνακα σε σαρωμένες ή φωτογραφημένες εικόνες, ακόμη και αν τα κύτταρα είναι σπασμένα, περιστρεφόμενα ή ατελείωτα φωτισμένα.
  • Υποστηρίζει διατάξεις πολλαπλών ρυτίδων και πολλών στήλων, κατεστραμμένα τραπέζια και διαφορετικά μεγέθη κυττάρων.
  • Παρέχει ιεραρχική εκπροσώπηση των γραμμών και των κυττάρων για απλοποιημένη μετά την επεξεργασία.

Εξαγωγή κειμένου κελιού

  • Αναγνωρίζει το κείμενο μέσα σε κάθε κύτταρο χρησιμοποιώντας προηγμένους αλγόριθμους OCR, διατηρώντας γραμμικές διακοπές, κεφαλαιοποίηση και αριθμητική μορφοποίηση.
  • Διαχειρίζεται πολλές γλώσσες σε ένα μόνο τραπέζι με προτεραιότητες γλωσσών που μπορούν να διαμορφωθούν.
  • Βελτιώνει τις στρεβλώσεις, όπως το σχήμα, η χαμηλή αντίθεση ή ο θόρυβος της εικόνας για να αυξήσει την ακρίβεια.

Ανασυγκρότηση και εξαγωγή τραπεζών

  • Ανακατασκευάζει τα ανιχνευμένα πίνακα σε δομές δεδομένων .NET (π.χ. DataTable) ή τα εξάγει σε μορφές CSV/TSV.
  • Δημιουργεί επεξεργαστικά αρχεία πλάκας (XLSX) τα οποία μπορούν να ανοίξουν στο Excel ή σε άλλα εργαλεία.
  • Διατηρεί τη βασική μορφοποίηση κυττάρων (αλληλεπίδραση, σύνορα) και συντονίζει τις εξαγωγές για προηγμένες ροές εργασίας.

Αναζητήσιμη και επεξεργασμένη έκδοση

  • Δημιουργεί κείμενα που μπορούν να αναζητηθούν σε PDF Εξαγωγές, καθιστώντας το περιεχόμενο του πίνακα indexable.
  • Ενσωματώνει αδιάλειπτα με το Aspose.Cells για προηγμένες λειτουργίες πλάκας όπως φόρμουλες και χάρτες.
  • Επιτρέπει την ενσωμάτωση του εξαγόμενου περιεχομένου σε βάσεις δεδομένων ή σε σωλήνες επεξεργασίας χαμηλής ροής.

Αποτελεσματικότητα και κλιμάκωση

  • Βελτιστοποιημένο για επεξεργασία συσκευών μεγάλων συστημάτων δεδομένων με διαμόρφωση και διαχείριση μνήμης.
  • Διαδίδει δεδομένα εικόνας απευθείας στον κινητήρα OCR, ελαχιστοποιώντας το δίσκο I/O.
  • Παρέχει κλήσεις προόδου και τα tokens ακύρωσης για μακροχρόνιες επιχειρήσεις.

Προχωρημένη προσαρμογή

  • Region-of-interest (ROI) υποστήριξη για τον περιορισμό της ανίχνευσης σε συγκεκριμένες περιοχές για ταχύτερη επεξεργασία.
  • Προσαρμοσμένα όρια εμπιστοσύνης για να φιλτράρετε τα αποτελέσματα χαμηλής αξιοπιστίας.
  • Συσκευές για προ- και μετά την επεξεργασία (προσαρμοσμένα φίλτρα, αλγόριθμοι αποχέτευσης ή επικυρωτές).

Παράδειγμα: Εξαγωγή κειμένου από σαρωμένες ή φωτογραφισμένες πίνακες

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

שימושים נפוצים

  • Εξαγωγή δομημένων δεδομένων από τις οικονομικές εκθέσεις.
  • Μετατροπή σαρωμένων μορφών και εφαρμογών σε πλάκες.
  • Αυτόματοποίηση των εργασιών εισόδου δεδομένων μετατρέποντας τις εικόνες του πίνακα σε επεξεργαζόμενες μορφές.

Συμβουλές και καλύτερες πρακτικές

  • Χρησιμοποιήστε εικόνες με τουλάχιστον 300 DPI και καλή αντίθεση για καλύτερα αποτελέσματα.
  • Προ-καλλιεργήστε ή αποσυνδέστε εικόνες για να απομονώσετε τις περιοχές του τραπεζιού.
  • Κατεβάστε μόνο τα απαραίτητα πακέτα γλώσσας για να μειώσετε τη χρήση μνήμης.
  • Τοποθετήστε τα όρια εμπιστοσύνης για να εξισορροπήσετε την ακρίβεια και τη μνήμη.
  • Εγκρίνετε τους ανακατασκευασμένους πίνακες ενάντια στα αναμενόμενα σχήματα πριν εισαγάγετε στις βάσεις δεδομένων.

Ακολουθώντας αυτές τις κατευθυντήριες γραμμές και εκμεταλλεύοντας τις δυνατότητες αναγνώρισης του πίνακα, το Aspose.OCR Table to Text for .NET παρέχει στους προγραμματιστές μια αξιόπιστη λύση για τη μετατροπή των σαρωμένων τραπεζών σε δομημένο, επεξεργασμένο και αναζησιμό κείμενο.

 Ελληνικά