Jako Aspose.OCR Tabela na Tekst dla .NET

Aspose.OCR Tabela do tekstu dla .NET jest potężnym wtyczkiem, który umożliwia deweloperom wyciągnięcie tekstu z skanowanych lub fotografowanych tabel o wysokiej dokładności. Odkrywa zaawansowane algorytmy uczenia się maszynowego i sieci nerwowe, wykrywa struktury tabeli, wyciąga tekst na poziomie komórkowym i organizuje wszystko w poszukiwanych, edytowalnych arkuszach lub tabularnych strukturach danych.

Instalacja i ustawienie

Aby rozpocząć, zainstaluj pakiet Aspose.OCR Tabela do tekstu za pośrednictwem NuGet lub pobierz montaż z serwerów ASPOSE Instalacja Przewodnik do szczegółowych kroków.Umożliwia pełną funkcjonalność poprzez konfigurację licencji mierzonych, jak opisano w Licencjonowanie według zużycia i dokumentacji.

Funkcje i funkcje

Wykrywanie tabeli i rozpoznawanie struktury

  • Automatycznie wykrywa granice tabeli w skanowanych lub fotografowanych obrazach, nawet jeśli komórki są skierowane, rotowane lub nierównomiernie oświetlone.
  • Obsługuje rozmieszczenia wielokrotne i wielo-kolumnowe, płyte tablice i różne rozmiary komórek.
  • Zapewnia hierarchiczną reprezentację kolejek i komórek dla uproszczonego post-przetwarzania.

Ekstrakcja tekstów komórkowych

  • Rozpoznaje tekst wewnątrz każdej komórki za pomocą zaawansowanych algorytmów OCR, zachowując przerwy linii, kapitalizację i formatowanie numeryczne.
  • Zarządzaj wieloma językami w jednej tabeli z konfigurowalnymi priorytetami językowymi.
  • Poprawia zniekształcenia, takie jak skok, niski kontrast lub dźwięk obrazu, aby zwiększyć dokładność.

Rekonstrukcja i eksport

  • Rekonstruuje wykryte tabele do struktur danych .NET (np. DataTable) lub eksportuje je do formatów CSV/TSV.
  • Generuje edytowalne pliki płytki (XLSX), które można otworzyć w programie Excel lub innych narzędzi.
  • Utrzymuje podstawową formatację komórek (alignment, granice) i koordynacje eksportowe dla zaawansowanych przepływów pracy.

Poszukiwane i edytowane wyniki

  • Produkuje wyszukiwane warstwy tekstu w PDF wywozy, co sprawia, że zawartość tabeli jest indeksowana.
  • Integruje bezprzewodowo z Aspose.Cells do zaawansowanych operacji płytki, takich jak formuły i wykresy.
  • Umożliwia włączenie zawartości wydanej do baz danych lub rurociągów przetwarzania w dół.

Wydajność i skalowalność

  • Optymalizowany do przetwarzania zbiorów dużych zestawów danych z konfiguracyjnym strumieniowaniem i zarządzaniem pamięcią.
  • Przepływ danych obrazu bezpośrednio do silnika OCR, minimalizując dysk I/O.
  • Zapewnia progres callbacks i tokeny anulowania dla długotrwałych operacji.

Zaawansowana personalizacja

  • Region-of-interest (ROI) wspiera ograniczenie wykrywania do określonych obszarów w celu szybszej przetwarzania.
  • Konfigurowane granice zaufania do filtrowania wyników o niskiej pewności siebie.
  • Płytki do przed- i po przetwarzaniu (filtry dostosowane, algorytmy wykończenia lub weryfikatory).

Przykład: Ekstrakcja tekstu z skanowanych lub fotografowanych tabel

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Typowe zastosowania

  • Wyciąganie strukturalnych danych z sprawozdań finansowych.
  • Konwertuj skanowane formularze i aplikacje na arkusze.
  • Automatyzacja zadań wprowadzania danych poprzez przekształcenie obrazów tabeli w edytowalne formaty.

Porady i najlepsze praktyki

  • Wykorzystaj obrazy z co najmniej 300 DPI i dobrym kontrastem dla najlepszych wyników.
  • Pre-crop lub deskew obrazy do izolacji obszarów tabeli.
  • Pobierz tylko niezbędne pakiety językowe, aby zmniejszyć wykorzystanie pamięci.
  • Utrzymuj granice zaufania, aby zrównoważyć precyzję i pamięć.
  • Validuj przebudowane tabele przeciwko oczekiwanym schematom przed importowaniem do baz danych.

Postępując zgodnie z tymi wytycznymi i wykorzystując swoje możliwości rozpoznawania tabel, Aspose.OCR Table to Text for .NET zapewnia programistom niezawodne rozwiązanie do przekształcania skanowanych tabel w strukturowany, edytowalny i wyszukiwany tekst.

 Polski