Aspose.OCR Tabell til tekst for .NET

Aspose.OCR Table to Text for .NET er en kraftig plugin som gjør det mulig for utviklere å trekke tekst fra skannede eller fotograferte tabeller med høy nøyaktighet. Levering av avanserte maskinlæring algoritmer og nevrale nettverk, detekterer tabellstrukturer, trekker tekst på cellenivå, og organiserer alt i søkbare, redigerbare spreadsheets eller tabeldata strukturer.

Installasjon og installasjon

For å komme i gang, installere Aspose.OCR Table to Text-pakken via NuGet eller laste ned assembly fra aspose-servere Installation Guide for detaljerte trinn.Muliggjøre full funksjonalitet ved å konfigurere målt lisens som beskrevet i målt lisens og dokumentasjon.

Egenskaper og funksjoner

Tabelldeteksjon og struktur anerkjennelse

  • Detekterer automatisk tabellgrenser i skannede eller fotograferte bilder, selv om celler er skredde, roterte eller uegnet lys.
  • Støtter multi-ro- og flerkolumn layouter, nestede tabeller og varierende cellestørrelser.
  • Det gir en hierarkisk representasjon av rader og celler for forenklet post-prosessering.

Cell tekst ekstraksjon

  • Identifiserer tekst i hver celle ved hjelp av avanserte OCR-algoritmer, bevare linjebrudd, kapitalisering og numerisk formatering.
  • Hanter flere språk i en enkelt tabell med konfigurerbare språkprioriteringer.
  • Korrigerer forvrengninger som skjegg, lavt kontrast eller billedstøy for å øke nøyaktigheten.

Rekonstruksjon og eksport

  • Rekonstruerer oppdagede tabeller i .NET-datastrukturer (f.eks. DataTable) eller eksporterer dem til CSV/TSV-format.
  • Genererer redigerbare spreadsheet-filer (XLSX) som kan åpnes i Excel eller andre verktøy.
  • Det opprettholder grunnleggende celleformatering (alignering, grenser) og eksport koordinater for avanserte arbeidsflyter.

Søkbar og redigerbar utgang

  • Produksjon av søkbare tekst lag i PDF Eksport, slik at tabellinnholdet kan indekseres.
  • Integrerer sømløst med Aspose.Cells for avanserte spreadsheet-operasjoner som formler og diagrammer.
  • Det gjør det mulig å integrere utvunnet innhold i databaser eller downstream behandlingsrør.

Effektivitet og scalability

  • Optimalisert for batchbehandling av store datasett med konfigurerbar stråling og hukommelsesstyring.
  • Strømmer bildedata direkte til OCR-motoren, minimere I/O-skjermen.
  • Det gir fremskritt callbacks og avbestillings tokener for langtidsoperasjoner.

avansert tilpasning

  • Region-of-interest (ROI) støtte for å begrense oppdagelsen til spesifikke områder for raskere behandling.
  • Konfigurerbare tillitsgrenser for å filtrere resultater med lav tillit.
  • Hooks for pre- og post-prosessering (passform filtre, dekkealgoritmer, eller validatorer).

Eksempel: Ekstrakter tekst fra skannede eller fotograferte tabeller

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Vanlige brukssaker

  • Utvinning av strukturerte data fra finansielle rapporter.
  • Konvertere skannede skjemaer og applikasjoner til spreadsheets.
  • Automatisering av datainnføringsoppgaver ved å forvandle tabellbilder til redigerbare formater.

Tips og beste praksis

  • Bruk bilder med minst 300 DPI og god kontrast for beste resultater.
  • Pre-crop eller deskew bilder for å isolere bordregioner.
  • Last bare på nødvendige språkpakker for å redusere hukommelsesbruk.
  • Tune tillitsgrenser for å balansere presisjon og minne.
  • Validerer rekonstruerte tabeller mot forventede ordninger før de importeres til databaser.

Ved å følge disse retningslinjene og utnytte tabell gjenkjenningskapasitetene, gir Aspose.OCR Table to Text for .NET utviklere en pålitelig løsning for å konvertere skannede tabeller til strukturert, redigerbar og søkbar tekst.

 Norsk