Converti la tabella Aspose.OCR in testo per .NET
Aspose.OCR Table to Text per .NET è un potente plugin che consente agli sviluppatori di estrarre il testo da tabelle scansionate o fotografate con alta precisione.Lavrendo algoritmi di apprendimento automatico avanzati e reti neurali, rileva le strutture di tavolo, tira testo a livello cellulare e organizza tutto in schede di ricerca edilizzabili o strutturazioni di dati tabellari.
Installazione e Setup
Per iniziare, installare il pacchetto Aspose.OCR Tabella a testo tramite NuGet o scaricare l’assemblaggio dai server Asposa Installazione Guida per passaggi dettagliati.Permette piena funzionalità configurando la licenza misurata come descritta nella Licenza a consumo della documentazione.
Caratteristiche e funzionalità
Dettagli di tabella e riconoscimento strutturale
- Detecta automaticamente i confini della tabella in immagini scansionate o fotografate, anche se le cellule sono spezzate, rotazionali o illuminate in modo sproporzionato.
- Supporta layout multi-ro e multi colonne, tabelle nestate e dimensioni cellulari diverse.
- Fornisce una rappresentazione gerarchica delle righe e delle cellule per la semplificazione post-processing.
L’estrazione del testo cellulare
- Riconosce il testo all’interno di ogni cellula utilizzando algoritmi OCR avanzati, preservando le interruzioni di linea, la capitalizzazione e la formattazione numerica.
- Gestire più lingue in una sola tabella con priorità linguistiche configurabili.
- Corregge distorsioni come scudo, basso contrasto o rumore dell’immagine per aumentare la precisione.
Ristrutturazione e esportazione
- Ricostruisce le tabelle rilevate in strutture dati .NET (ad esempio DataTable) o le esporta in formati CSV/TSV.
- Generare file di scheda edilizzabile (XLSX) che possono essere aperti in Excel o altri strumenti.
- Mantiene il formato delle cellule di base (alignamento, confini) e le coordinate di esportazione per i flussi di lavoro avanzati.
Risultati ricercabili ed editabili
- Produce strati di testo in cerca Il PDF esportazioni, rendendo indexabile il contenuto della tabella.
- Integra senza sforzo con Aspose.Cell per le operazioni avanzate di scheda come le formule e la grafica.
- Permette l’inserimento del contenuto estratto in database o tubi di elaborazione downstream.
Performance e scalabilità
- Ottimizzato per il processamento di batch di grandi set di dati con la configurabilità e la gestione della memoria.
- Stream dati immagine direttamente al motore OCR, minimizzando il disco I/O.
- Fornisce appuntamenti di progresso e token di cancellazione per le operazioni a lungo termine.
personalizzazione avanzata
- Regione di interesse (ROI) supporto per limitare la rilevazione a aree specifiche per un trattamento più veloce.
- Limiti di fiducia configurabili per filtrare i risultati a basso livello.
- Hooks per pre- e post-processing (filtratori personalizzati, algoritmi di dischi, o validatori).
Esempio: Estratto di testo da tabelle scansionate o fotografate
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;
// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Casi d’uso comuni
- Sfruttare i dati strutturati dai rapporti finanziari.
- Convertire form e applicazioni scansionate in schede.
- Automatizzare i compiti di ingresso dei dati trasformando le immagini di tabella in formati modificabili.
Suggerimenti e migliori pratiche
- Utilizzare immagini con almeno 300 DPI e un buon contrasto per i migliori risultati.
- Pre-crop o deskew immagini per isolare le regioni del tavolo.
- Carica solo i pacchetti linguistici necessari per ridurre l’uso della memoria.
- Tuni i limiti di fiducia per bilanciare precisione e ricordo.
- Validare le tabelle ricostruite contro gli schemi attesi prima di importare in database.
Seguendo queste linee guida e sfruttando le sue capacità di riconoscimento della tabella, Aspose.OCR Table to Text for .NET fornisce agli sviluppatori una soluzione affidabile per convertire le tabelle scansionate in testo strutturato, modificabile e ricercabile.