Aspose.OCR Tabell till Text för .NET

Aspose.OCR Table to Text för .NET är en kraftfull plugin som gör det möjligt för utvecklare att extrahera text från skannade eller fotograferade tabeller med hög noggrannhet. Leverans av avancerade maskininlärningsalgoritmer och neurala nätverk, det upptäcker tabellstrukturer, drar cellnivå text, och organiserar allt i sökbara, redigerbara spreadsheets eller tabeldata strukturer.

Installation och installation

För att komma igång, installera Aspose.OCR Table to Text-paketet via NuGet eller ladda ner inställningen från aspose-servrar Installation Guide för detaljerade steg.Tillåta full funktionalitet genom att konfigurera måttlig licens som beskrivs i Mätlicensiering och dokumentation.

Funktioner och funktioner

Tabelldetektion och strukturidentifiering

  • Detekterar automatiskt tabellgränser i skannade eller fotograferade bilder, även om cellerna är skjutna, roterade, eller ojämnt belysade.
  • Stödjer fler och fler kolumner layouter, nestade tabeller och olika cellstorlekar.
  • Tillhandahåller en hierarkisk representation av rader och celler för förenklad postbehandling.

Cell text extraktion

  • Det känner igen text inom varje cell med hjälp av avancerade OCR-algoritmer, bevarar linjebrott, kapitalisering och numerisk formatering.
  • Hantera flera språk i en enda tabell med konfigurerbara språkprioriteringar.
  • Korrigerar förvrängningar som skiv, låg kontrast eller bildljud för att öka noggrannheten.

Rekonstruktion och export

  • Rekonstruerar upptäckta tabeller till .NET-datastrukturer (t.ex. DataTable) eller exporterar dem till CSV/TSV-format.
  • Genererar redigerbara skivfiler (XLSX) som kan öppnas i Excel eller andra verktyg.
  • Håller grundläggande cellformatering (alignering, gränser) och exporterar koordinater för avancerade arbetsflöden.

Sökbar och redigerbar utgång

  • Tillverkar sökbara textlagrar i PDF exporteras, vilket gör tabellinnehåll indexbar.
  • Integrerar smidigt med Aspose.Cells för avancerade spreadsheet-operationer som formler och diagram.
  • Tillåter införlivande av extraherat innehåll i databaser eller nedströmsbearbetningsrör.

Prestanda och skalbarhet

  • Optimerad för batchbehandling av stora dataset med konfigurerbart strängning och minnehantering.
  • Flytta bilddata direkt till OCR-motorn, minimera disken I/O.
  • Tillhandahåller framsteg callbacks och avbokning tokens för långvariga operationer.

Avancerad anpassning

  • Region-of-interest (ROI) stöd för att begränsa upptäckt till specifika områden för snabbare bearbetning.
  • Konfigurerbara förtroendegränser för att filtrera lågförtroendets resultat.
  • Hooks för före och efter bearbetning (anpassade filter, deck algorithmer eller validatorer).

Exempel: Extrahera text från scannade eller fotograferade tabeller

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Vanliga användningsfall

  • Att extrahera strukturerade data från finansiella rapporter.
  • Konvertera skannade formulär och applikationer till spreadsheets.
  • Automatisera uppgifterna för dataintag genom att omvandla tabellbilder till redigerbara format.

Tips och bästa praxis

  • Använd bilder med minst 300 DPI och bra kontrast för bästa resultat.
  • Pre-crop eller deskew bilder för att isolera tabellregioner.
  • Ladda bara nödvändiga språkpaket för att minska minnesanvändningen.
  • Lämna tröskelvärdena för att balansera precision och minne.
  • Validerar ombyggda tabeller mot förväntade scheman innan de importeras till databaser.

Genom att följa dessa riktlinjer och utnyttja dess tabelluppsamlingskapacitet ger Aspose.OCR Tabell till Text för .NET utvecklare en pålitlig lösning för att omvandla scannade tabeller till strukturerad, redigerbar och sökbar text.

 Svenska