Aspose.OCR tabel pentru text pentru .NET

Aspose.OCR Table to Text pentru .NET este un plug-in puternic care permite dezvoltatorilor să extragă text din tabele scanate sau fotografiate cu precizie ridicată.Dezvoltând algoritmi de învățare automată avansate și rețele neurale, detectează structurile de tabel, atrage textul la nivel celular și organizează totul într-o structură de date tabloidă, editabilă sau accesibilă.

Instalare și setare

Pentru a începe, instalați pachetul Aspose.OCR Table to Text prin intermediul NuGet sau descărcați setul de pe servere Instalare Ghid pentru pași detaliati.Permite funcționalitatea completă prin configurarea licenței măsurate, așa cum este descrisă în Licență măsurată în documentare.

Caracteristici și funcții

Detectarea tabelului și recunoașterea structurii

  • Detectează automat frontierele tabelului în imagini scanate sau fotografiate, chiar dacă celulele sunt scutite, rotați sau iluminate inegal.
  • Susține layouturi multi-ro și multi coloane, tabele nestate și dimensiunile celulelor diferite.
  • Oferă o reprezentare ierarhică a rândurilor și celulelor pentru post-procesarea simplificată.

Extracția textului celular

  • Recunoaște textul în interiorul fiecărei celule folosind algoritmi OCR avansate, păstrând pauzele de linie, capitalizarea și formatarea numerică.
  • Manipulează mai multe limbi într-o singură tabelă cu priorități lingvistice configurabile.
  • Corectează distorțiile, cum ar fi zgârirea, contrastul redus sau zgomotul imaginii pentru a spori precizia.

Restaurarea şi exportul de masă

  • Reconstruiește tabelele detectate în structurile de date .NET (de exemplu, DataTable) sau le exportă în formate CSV/TSV.
  • Generă fișiere de etichetă editabilă (XLSX) care pot fi deschise în Excel sau alte instrumente.
  • Păstrează formatarea celulelor de bază (alignare, frontiere) și coordonate de export pentru fluxurile de lucru avansate.

Rezultate căutate și editabile

  • Produsă straturi de text căutate în PDF Exporturi, făcând conținutul tabelului indexabil.
  • Integră fără fir cu Aspose.Cells pentru operațiuni avansate, cum ar fi formule și diagrame.
  • Permite încorporarea conținutului extras în baze de date sau în conducte de prelucrare.

Performanță și scalabilitate

  • Optimizat pentru prelucrarea cu batch a seturilor de date mari, cu configurabilitate și management de memorie.
  • Stream datele imaginii direct la motorul OCR, minimizând discul I/O.
  • Oferă apeluri avansate și tokenuri de anulare pentru operațiuni pe termen lung.

personalizare avansată

  • Regiune de interes (ROI) sprijină limitarea detectării la zone specifice pentru prelucrarea mai rapidă.
  • Limitele de încredere configurabile pentru a filtra rezultatele cu incredere scăzută.
  • Hocuri pentru prelucrarea pre- și post-procesare (filtre personalizate, algoritmi de descărcare sau validatori).

Exemplu: Extract text din tabele scanate sau fotografiate

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

cazuri comune de utilizare

  • Extragerea datelor structurate din rapoartele financiare.
  • Conversia formularelor și aplicațiilor scanate în broșuri.
  • Automatizarea sarcinilor de intrare a datelor prin transformarea imaginilor tabelului în formate editabile.

Sfaturi și cele mai bune practici

  • Utilizați imagini cu cel puțin 300 DPI și un contrast bun pentru cele mai bune rezultate.
  • Pre-crop sau deskew imagini pentru a izola regiunile de masă.
  • Încărcați numai pachetul de limbă necesar pentru a reduce utilizarea memoriei.
  • Puneți pragurile de încredere pentru a echilibra precizia și amintirea.
  • Validați tabelele reconstruite împotriva schemelor așteptate înainte de a importa în bazele de date.

Prin urmărirea acestor orientări și utilizarea capacităților sale de recunoaștere a tabelului, Aspose.OCR Table to Text for .NET oferă dezvoltatorilor o soluție fiabilă pentru a transforma tabelele scanate în text structurat, editabil și căutat.

 Română