Aspose.OCR - przekształć zdjęcie na tekst dla .NET

Wbudowany na sprawdzonym silniku Aspose.OCR, wtyczka ta stosuje zaawansowane filtry przed przetwarzaniem – takie jak korekcja rotacji, kompensacja zakłóceń i usuwanie hałasu – aby zapewnić wysoką dokładność rozpoznawania nawet na skierowanych, niskich kontrastach lub głośnych obrazach.

Instalacja i ustawienie

Rozpoczęcie jest proste:

  • Instaluj pakiet Aspose.OCR za pośrednictwem NuGet lub z pobranego dystrybutora.See Instalacja dla szczegółowych instrukcji.
  • Konfiguruj ustawione licencje na startu, aby odblokować pełną funkcjonalność.Odwołuje się do Licencjonowanie według zużycia do kroków ustawień.

Przykład: ekstrakcja tekstu z zdjęć

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;

// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Funkcje i funkcje

Zaawansowane filtry przed przetwarzaniem

  • Rotacja i Skew Korekcja : Automatycznie wyprostowanie zdjęć naciśniętych.
  • Distortion Compensation : poprawia obiektyw indukowany przez soczewkę i warping perspektywy.
  • Redukcja hałasu : hamuje spektrum, pył i kompresje.
  • Kontrast i dostosowanie jasności : Optymalizuje oświetlenie dla niejasnych lub nadeksponowanych obrazów.

Silny silnik rozpoznawania tekstów

  • Wielojęzyczne skrypty OCR (latyński, cyrylski, arabski i CJK).
  • Detekcja diagnostyczna czcionki obsługująca drukowany tekst, podpis i skanowanie.
  • Automatyczna segmentacja skryptów na mieszanych stronach językowych.
  • Rozpoznawanie liczb, symboli i punktowania z konfigurowalnymi granicami.

Analiza rozmiaru i segmentacja

  • Automatyczne wykrywanie bloków tekstowych w porównaniu z grafikami lub tabelami.
  • Segmentacja kolumny i linii zachowuje naturalny porządek czytania.
  • OCR oparte na strefie do celowania określonych regionów.

Formaty wyjściowe i ekstrakcja danych

  • Eksportowanie płaskich tekstów, strukturowanych przedmiotów lub JSON z koordynacjami bounding-box.
  • Odzyskanie wyników zaufania linii po linii do weryfikacji.
  • Generate PDF lub wyjścia tekstowe bezpośrednio do użytku downstream.

Batch i równoległe przetwarzanie

  • Rozpoznawanie równoległe za pomocą .NET async/await.
  • Zarządzanie kwasem dla dużych ładunków roboczych.
  • Wsparcie dla długotrwałych zadań.

Dostosowanie i rozszerzalność

  • Określenie filtrów filtracyjnych.
  • Dodaj słownictwo lub słońce, aby poprawić dokładność.
  • Dołącz do wydarzeń rozpoznawczych w celu logowania lub kontroli pośredniej.

Tuning wydajności

  • Dostosuj rozdzielczość i głębokość koloru, aby uzyskać równowagę między prędkością a dokładnością.
  • Cache uprzednio przetworzonych buferów podczas pracy z powtarzającymi się szablonami.
  • Profilowe etapy rurociągu do izolacji butelek.

Porady i najlepsze praktyki

  • Wstępnie wybrane lub uprawiane obszary zainteresowania w celu zminimalizowania czasu przetwarzania.
  • Test parametrów filtra na próbkach reprezentatywnych przed uruchomieniem.
  • Użyj wyników zaufania, aby zbudować przepływy upadłości lub ludzkiej weryfikacji.
  • W przypadku zdjęć komórkowych należy zapewnić odpowiednie oświetlenie i kontrastowe tło.
  • Monitorowanie wykorzystania pamięci z biegiem batch; zastosowanie tokenów anulowania w razie potrzeby.
  • Połączenie eksportu JSON z usługami weryfikacji w celu budowania solidnych rur danych.

Często zadawane pytania

**Czy potrzebne jest określenie języka?**Zgodnie ze standardem wtyczka automatycznie wykrywa wiele języków. jednak wyraźnie ustawienie języka poprawia dokładność skryptów, takich jak cyrylski, chiński lub hindi.

**Jakie formaty są obsługiwane?**JPEG, PNG, TIFF, PDF i inne popularne formaty z skanery lub kamery. Wyniki mogą być eksportowane jako płaski tekst, HTML, Word, pdf, JSON lub XML.

**Jak mogę uzyskać najlepsze wyniki?**Wykorzystaj wysokiej jakości obrazy ze skanera lub nowoczesnych aparatów fotograficznych.Wbudowane filtry poprawiają jakość obrazu przed rozpoznaniem.

 Polski