Converti la tabella Aspose.OCR in testo per .NET

Aspose.OCR Table to Text per .NET è un potente plugin che consente agli sviluppatori di estrarre il testo da tabelle scansionate o fotografate con alta precisione.Lavrendo algoritmi di apprendimento automatico avanzati e reti neurali, rileva le strutture di tavolo, tira testo a livello cellulare e organizza tutto in schede di ricerca edilizzabili o strutturazioni di dati tabellari.

Installazione e Setup

Per iniziare, installare il pacchetto Aspose.OCR Tabella a testo tramite NuGet o scaricare l’assemblaggio dai server Asposa Installazione Guida per passaggi dettagliati.Permette piena funzionalità configurando la licenza misurata come descritta nella Licenza a consumo della documentazione.

Caratteristiche e funzionalità

Dettagli di tabella e riconoscimento strutturale

  • Detecta automaticamente i confini della tabella in immagini scansionate o fotografate, anche se le cellule sono spezzate, rotazionali o illuminate in modo sproporzionato.
  • Supporta layout multi-ro e multi colonne, tabelle nestate e dimensioni cellulari diverse.
  • Fornisce una rappresentazione gerarchica delle righe e delle cellule per la semplificazione post-processing.

L’estrazione del testo cellulare

  • Riconosce il testo all’interno di ogni cellula utilizzando algoritmi OCR avanzati, preservando le interruzioni di linea, la capitalizzazione e la formattazione numerica.
  • Gestire più lingue in una sola tabella con priorità linguistiche configurabili.
  • Corregge distorsioni come scudo, basso contrasto o rumore dell’immagine per aumentare la precisione.

Ristrutturazione e esportazione

  • Ricostruisce le tabelle rilevate in strutture dati .NET (ad esempio DataTable) o le esporta in formati CSV/TSV.
  • Generare file di scheda edilizzabile (XLSX) che possono essere aperti in Excel o altri strumenti.
  • Mantiene il formato delle cellule di base (alignamento, confini) e le coordinate di esportazione per i flussi di lavoro avanzati.

Risultati ricercabili ed editabili

  • Produce strati di testo in cerca Il PDF esportazioni, rendendo indexabile il contenuto della tabella.
  • Integra senza sforzo con Aspose.Cell per le operazioni avanzate di scheda come le formule e la grafica.
  • Permette l’inserimento del contenuto estratto in database o tubi di elaborazione downstream.

Performance e scalabilità

  • Ottimizzato per il processamento di batch di grandi set di dati con la configurabilità e la gestione della memoria.
  • Stream dati immagine direttamente al motore OCR, minimizzando il disco I/O.
  • Fornisce appuntamenti di progresso e token di cancellazione per le operazioni a lungo termine.

personalizzazione avanzata

  • Regione di interesse (ROI) supporto per limitare la rilevazione a aree specifiche per un trattamento più veloce.
  • Limiti di fiducia configurabili per filtrare i risultati a basso livello.
  • Hooks per pre- e post-processing (filtratori personalizzati, algoritmi di dischi, o validatori).

Esempio: Estratto di testo da tabelle scansionate o fotografate

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Casi d’uso comuni

  • Sfruttare i dati strutturati dai rapporti finanziari.
  • Convertire form e applicazioni scansionate in schede.
  • Automatizzare i compiti di ingresso dei dati trasformando le immagini di tabella in formati modificabili.

Suggerimenti e migliori pratiche

  • Utilizzare immagini con almeno 300 DPI e un buon contrasto per i migliori risultati.
  • Pre-crop o deskew immagini per isolare le regioni del tavolo.
  • Carica solo i pacchetti linguistici necessari per ridurre l’uso della memoria.
  • Tuni i limiti di fiducia per bilanciare precisione e ricordo.
  • Validare le tabelle ricostruite contro gli schemi attesi prima di importare in database.

Seguendo queste linee guida e sfruttando le sue capacità di riconoscimento della tabella, Aspose.OCR Table to Text for .NET fornisce agli sviluppatori una soluzione affidabile per convertire le tabelle scansionate in testo strutturato, modificabile e ricercabile.

 Italiano