Aspose.OCR Taula a text per a .NET
Aspose.OCR Table to Text per a .NET és un poderós plugin que permet als desenvolupadors extreure text de taules escanejades o fotografiades amb alta precisió. Leveraging avançats algoritmes d’aprenentatge de màquina i xarxes neurals, detecta estructures de Taula, treu el text a nivell cel·lular, i organitza tot en cercables, editats tauletes o dades tabulars.
Instal·lació i configuració
Per començar, instal·leu el paquet Aspose.OCR de taula a text a través de NuGet o descarregueu l’assembla dels servidors d’Aspo Instal·lació Guia per a passos detallats.Permet la plena funcionalitat configurant la llicència mesurada tal com es descriu en el Llicència Metrada la documentació.
Característiques i funcionalitats
Detecció de taula i reconeixement estructural
- Detecta automàticament els límits de la taula en imatges escanejades o fotografiades, fins i tot si les cèl·lules són esquivades.
- Suporta els dissenys multi-rous i multi columnes, taules nestades i diferents mides de cèl·lula.
- Proporciona una representació jeràrquica de files i cèl·lules per a la simplificació del postprocessament.
Extracció de text cel·lular
- Reconeix el text dins de cada cèl·lula utilitzant algoritmes OCR avançats, preservant breus de línia, capitalització i formatació numèrica.
- Gestionar múltiples llengües en una sola taula amb prioritats lingüístiques configurables.
- Correix les distorsions com l’escull, el baix contrast o el soroll d’imatge per augmentar la precisió.
Reconstrucció i exportació de taula
- Reconstrueix taules detectades en estructures de dades .NET (per exemple, DataTable) o les exporta en formats CSV/TSV.
- Genera arxius de fletxa editables (XLSX) que es poden obrir en Excel o altres eines.
- Manté la formatació de cèl·lules bàsiques (alignament, fronteres) i les coordinacions d’exportació per a fluxos de treball avançats.
Resultats buscables i editables
- Produeix les capes de text buscables en PDF Exportacions, fent que el contingut de taula sigui indexable.
- Integra sens dubte amb Aspose.Cells per a operacions avançades com fórmules i gràfics.
- Permet incorporar continguts extraïts en bases de dades o tubs de processament de baix flux.
Performances i escalabilitat
- Optimitzat per al processament de batxines de grans set de dades amb la configuració i la gestió de la memòria.
- Streams dades d’imatge directament al motor OCR, minimitzant el disc I/O.
- Proporciona trucs de progrés i tokens d’anul·lació per a operacions de llarg termini.
Adaptació avançada
- Regió d’interès (ROI) suport per limitar la detecció a àrees específiques per a un processament més ràpid.
- Els límits de confiança configurables per filtrar els resultats de baixa confiància.
- Hoxes per a pre- i post-processament (filtres personalitzats, algoritmes de desquema, o validadors).
Exemple: Extreure text de taules escanades o fotografiades
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;
// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Casos d’ús comú
- Extracció de dades estructurades dels informes financers.
- Convertir formularis i aplicacions escanejades en tauletes.
- Automatitzar les tasques d’entrada de dades transformant imatges de taula en formats editables.
Consells i millors pràctiques
- Utilitzeu imatges amb un mínim de 300 dpi i un bon contrast per obtenir els millors resultats.
- Pre-crop o desqueig imatges per a aïllar les regions de taula.
- Carregar només els paquets de llenguatge necessaris per reduir l’ús de la memòria.
- Tuneu els límits de confiança per equilibrar la precisió i el record.
- Valida les taules reconstruïdes contra els esquemes esperats abans d’importar-les a les bases de dades.
Seguint aquestes directrius i aprofitant les seves capacitats de reconeixement de taula, Aspose.OCR Taula a text per .NET proporciona als desenvolupadors una solució fiable per convertir taules escanejades en text estructurat, edible i buscable.