Aspose.OCR Tabell til tekst for .NET
Aspose.OCR Table to Text for .NET er en kraftig plugin som gjør det mulig for utviklere å trekke tekst fra skannede eller fotograferte tabeller med høy nøyaktighet. Levering av avanserte maskinlæring algoritmer og nevrale nettverk, detekterer tabellstrukturer, trekker tekst på cellenivå, og organiserer alt i søkbare, redigerbare spreadsheets eller tabeldata strukturer.
Installasjon og installasjon
For å komme i gang, installere Aspose.OCR Table to Text-pakken via NuGet eller laste ned assembly fra aspose-servere Installation Guide for detaljerte trinn.Muliggjøre full funksjonalitet ved å konfigurere målt lisens som beskrevet i målt lisens og dokumentasjon.
Egenskaper og funksjoner
Tabelldeteksjon og struktur anerkjennelse
- Detekterer automatisk tabellgrenser i skannede eller fotograferte bilder, selv om celler er skredde, roterte eller uegnet lys.
- Støtter multi-ro- og flerkolumn layouter, nestede tabeller og varierende cellestørrelser.
- Det gir en hierarkisk representasjon av rader og celler for forenklet post-prosessering.
Cell tekst ekstraksjon
- Identifiserer tekst i hver celle ved hjelp av avanserte OCR-algoritmer, bevare linjebrudd, kapitalisering og numerisk formatering.
- Hanter flere språk i en enkelt tabell med konfigurerbare språkprioriteringer.
- Korrigerer forvrengninger som skjegg, lavt kontrast eller billedstøy for å øke nøyaktigheten.
Rekonstruksjon og eksport
- Rekonstruerer oppdagede tabeller i .NET-datastrukturer (f.eks. DataTable) eller eksporterer dem til CSV/TSV-format.
- Genererer redigerbare spreadsheet-filer (XLSX) som kan åpnes i Excel eller andre verktøy.
- Det opprettholder grunnleggende celleformatering (alignering, grenser) og eksport koordinater for avanserte arbeidsflyter.
Søkbar og redigerbar utgang
- Produksjon av søkbare tekst lag i PDF Eksport, slik at tabellinnholdet kan indekseres.
- Integrerer sømløst med Aspose.Cells for avanserte spreadsheet-operasjoner som formler og diagrammer.
- Det gjør det mulig å integrere utvunnet innhold i databaser eller downstream behandlingsrør.
Effektivitet og scalability
- Optimalisert for batchbehandling av store datasett med konfigurerbar stråling og hukommelsesstyring.
- Strømmer bildedata direkte til OCR-motoren, minimere I/O-skjermen.
- Det gir fremskritt callbacks og avbestillings tokener for langtidsoperasjoner.
avansert tilpasning
- Region-of-interest (ROI) støtte for å begrense oppdagelsen til spesifikke områder for raskere behandling.
- Konfigurerbare tillitsgrenser for å filtrere resultater med lav tillit.
- Hooks for pre- og post-prosessering (passform filtre, dekkealgoritmer, eller validatorer).
Eksempel: Ekstrakter tekst fra skannede eller fotograferte tabeller
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;
// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Vanlige brukssaker
- Utvinning av strukturerte data fra finansielle rapporter.
- Konvertere skannede skjemaer og applikasjoner til spreadsheets.
- Automatisering av datainnføringsoppgaver ved å forvandle tabellbilder til redigerbare formater.
Tips og beste praksis
- Bruk bilder med minst 300 DPI og god kontrast for beste resultater.
- Pre-crop eller deskew bilder for å isolere bordregioner.
- Last bare på nødvendige språkpakker for å redusere hukommelsesbruk.
- Tune tillitsgrenser for å balansere presisjon og minne.
- Validerer rekonstruerte tabeller mot forventede ordninger før de importeres til databaser.
Ved å følge disse retningslinjene og utnytte tabell gjenkjenningskapasitetene, gir Aspose.OCR Table to Text for .NET utviklere en pålitelig løsning for å konvertere skannede tabeller til strukturert, redigerbar og søkbar tekst.