Aspose.OCR - przekształć zdjęcie na tekst dla .NET
Wbudowany na sprawdzonym silniku Aspose.OCR, wtyczka ta stosuje zaawansowane filtry przed przetwarzaniem – takie jak korekcja rotacji, kompensacja zakłóceń i usuwanie hałasu – aby zapewnić wysoką dokładność rozpoznawania nawet na skierowanych, niskich kontrastach lub głośnych obrazach.
Instalacja i ustawienie
Rozpoczęcie jest proste:
- Instaluj pakiet Aspose.OCR za pośrednictwem NuGet lub z pobranego dystrybutora.See Instalacja dla szczegółowych instrukcji.
- Konfiguruj ustawione licencje na startu, aby odblokować pełną funkcjonalność.Odwołuje się do Licencjonowanie według zużycia do kroków ustawień.
Przykład: ekstrakcja tekstu z zdjęć
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Funkcje i funkcje
Zaawansowane filtry przed przetwarzaniem
- Rotacja i Skew Korekcja : Automatycznie wyprostowanie zdjęć naciśniętych.
- Distortion Compensation : poprawia obiektyw indukowany przez soczewkę i warping perspektywy.
- Redukcja hałasu : hamuje spektrum, pył i kompresje.
- Kontrast i dostosowanie jasności : Optymalizuje oświetlenie dla niejasnych lub nadeksponowanych obrazów.
Silny silnik rozpoznawania tekstów
- Wielojęzyczne skrypty OCR (latyński, cyrylski, arabski i CJK).
- Detekcja diagnostyczna czcionki obsługująca drukowany tekst, podpis i skanowanie.
- Automatyczna segmentacja skryptów na mieszanych stronach językowych.
- Rozpoznawanie liczb, symboli i punktowania z konfigurowalnymi granicami.
Analiza rozmiaru i segmentacja
- Automatyczne wykrywanie bloków tekstowych w porównaniu z grafikami lub tabelami.
- Segmentacja kolumny i linii zachowuje naturalny porządek czytania.
- OCR oparte na strefie do celowania określonych regionów.
Formaty wyjściowe i ekstrakcja danych
- Eksportowanie płaskich tekstów, strukturowanych przedmiotów lub JSON z koordynacjami bounding-box.
- Odzyskanie wyników zaufania linii po linii do weryfikacji.
- Generate PDF lub wyjścia tekstowe bezpośrednio do użytku downstream.
Batch i równoległe przetwarzanie
- Rozpoznawanie równoległe za pomocą .NET async/await.
- Zarządzanie kwasem dla dużych ładunków roboczych.
- Wsparcie dla długotrwałych zadań.
Dostosowanie i rozszerzalność
- Określenie filtrów filtracyjnych.
- Dodaj słownictwo lub słońce, aby poprawić dokładność.
- Dołącz do wydarzeń rozpoznawczych w celu logowania lub kontroli pośredniej.
Tuning wydajności
- Dostosuj rozdzielczość i głębokość koloru, aby uzyskać równowagę między prędkością a dokładnością.
- Cache uprzednio przetworzonych buferów podczas pracy z powtarzającymi się szablonami.
- Profilowe etapy rurociągu do izolacji butelek.
Porady i najlepsze praktyki
- Wstępnie wybrane lub uprawiane obszary zainteresowania w celu zminimalizowania czasu przetwarzania.
- Test parametrów filtra na próbkach reprezentatywnych przed uruchomieniem.
- Użyj wyników zaufania, aby zbudować przepływy upadłości lub ludzkiej weryfikacji.
- W przypadku zdjęć komórkowych należy zapewnić odpowiednie oświetlenie i kontrastowe tło.
- Monitorowanie wykorzystania pamięci z biegiem batch; zastosowanie tokenów anulowania w razie potrzeby.
- Połączenie eksportu JSON z usługami weryfikacji w celu budowania solidnych rur danych.
Często zadawane pytania
**Czy potrzebne jest określenie języka?**Zgodnie ze standardem wtyczka automatycznie wykrywa wiele języków. jednak wyraźnie ustawienie języka poprawia dokładność skryptów, takich jak cyrylski, chiński lub hindi.
**Jakie formaty są obsługiwane?**JPEG, PNG, TIFF, PDF i inne popularne formaty z skanery lub kamery. Wyniki mogą być eksportowane jako płaski tekst, HTML, Word, pdf, JSON lub XML.
**Jak mogę uzyskać najlepsze wyniki?**Wykorzystaj wysokiej jakości obrazy ze skanera lub nowoczesnych aparatów fotograficznych.Wbudowane filtry poprawiają jakość obrazu przed rozpoznaniem.