Jako Aspose.OCR Tabela na Tekst dla .NET
Aspose.OCR Tabela do tekstu dla .NET jest potężnym wtyczkiem, który umożliwia deweloperom wyciągnięcie tekstu z skanowanych lub fotografowanych tabel o wysokiej dokładności. Odkrywa zaawansowane algorytmy uczenia się maszynowego i sieci nerwowe, wykrywa struktury tabeli, wyciąga tekst na poziomie komórkowym i organizuje wszystko w poszukiwanych, edytowalnych arkuszach lub tabularnych strukturach danych.
Instalacja i ustawienie
Aby rozpocząć, zainstaluj pakiet Aspose.OCR Tabela do tekstu za pośrednictwem NuGet lub pobierz montaż z serwerów ASPOSE Instalacja Przewodnik do szczegółowych kroków.Umożliwia pełną funkcjonalność poprzez konfigurację licencji mierzonych, jak opisano w Licencjonowanie według zużycia i dokumentacji.
Funkcje i funkcje
Wykrywanie tabeli i rozpoznawanie struktury
- Automatycznie wykrywa granice tabeli w skanowanych lub fotografowanych obrazach, nawet jeśli komórki są skierowane, rotowane lub nierównomiernie oświetlone.
- Obsługuje rozmieszczenia wielokrotne i wielo-kolumnowe, płyte tablice i różne rozmiary komórek.
- Zapewnia hierarchiczną reprezentację kolejek i komórek dla uproszczonego post-przetwarzania.
Ekstrakcja tekstów komórkowych
- Rozpoznaje tekst wewnątrz każdej komórki za pomocą zaawansowanych algorytmów OCR, zachowując przerwy linii, kapitalizację i formatowanie numeryczne.
- Zarządzaj wieloma językami w jednej tabeli z konfigurowalnymi priorytetami językowymi.
- Poprawia zniekształcenia, takie jak skok, niski kontrast lub dźwięk obrazu, aby zwiększyć dokładność.
Rekonstrukcja i eksport
- Rekonstruuje wykryte tabele do struktur danych .NET (np. DataTable) lub eksportuje je do formatów CSV/TSV.
- Generuje edytowalne pliki płytki (XLSX), które można otworzyć w programie Excel lub innych narzędzi.
- Utrzymuje podstawową formatację komórek (alignment, granice) i koordynacje eksportowe dla zaawansowanych przepływów pracy.
Poszukiwane i edytowane wyniki
- Produkuje wyszukiwane warstwy tekstu w PDF wywozy, co sprawia, że zawartość tabeli jest indeksowana.
- Integruje bezprzewodowo z Aspose.Cells do zaawansowanych operacji płytki, takich jak formuły i wykresy.
- Umożliwia włączenie zawartości wydanej do baz danych lub rurociągów przetwarzania w dół.
Wydajność i skalowalność
- Optymalizowany do przetwarzania zbiorów dużych zestawów danych z konfiguracyjnym strumieniowaniem i zarządzaniem pamięcią.
- Przepływ danych obrazu bezpośrednio do silnika OCR, minimalizując dysk I/O.
- Zapewnia progres callbacks i tokeny anulowania dla długotrwałych operacji.
Zaawansowana personalizacja
- Region-of-interest (ROI) wspiera ograniczenie wykrywania do określonych obszarów w celu szybszej przetwarzania.
- Konfigurowane granice zaufania do filtrowania wyników o niskiej pewności siebie.
- Płytki do przed- i po przetwarzaniu (filtry dostosowane, algorytmy wykończenia lub weryfikatory).
Przykład: Ekstrakcja tekstu z skanowanych lub fotografowanych tabel
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;
// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Typowe zastosowania
- Wyciąganie strukturalnych danych z sprawozdań finansowych.
- Konwertuj skanowane formularze i aplikacje na arkusze.
- Automatyzacja zadań wprowadzania danych poprzez przekształcenie obrazów tabeli w edytowalne formaty.
Porady i najlepsze praktyki
- Wykorzystaj obrazy z co najmniej 300 DPI i dobrym kontrastem dla najlepszych wyników.
- Pre-crop lub deskew obrazy do izolacji obszarów tabeli.
- Pobierz tylko niezbędne pakiety językowe, aby zmniejszyć wykorzystanie pamięci.
- Utrzymuj granice zaufania, aby zrównoważyć precyzję i pamięć.
- Validuj przebudowane tabele przeciwko oczekiwanym schematom przed importowaniem do baz danych.
Postępując zgodnie z tymi wytycznymi i wykorzystując swoje możliwości rozpoznawania tabel, Aspose.OCR Table to Text for .NET zapewnia programistom niezawodne rozwiązanie do przekształcania skanowanych tabel w strukturowany, edytowalny i wyszukiwany tekst.