Aspose.OCR Faktura na Tekst dla .NET
Aspose.OCR Invoice to Text for .NET to specjalny plug-in zaprojektowany w celu ułatwienia ekstrakcji strukturowanego tekstu z skanowanych lub fotografowanych faktur. poprzez automatyzację kluczowych kroków – przedprzetwarzania obrazu, analizy układu i OCR – można dostarczać wynikające dane bezpośrednio do systemów rachunkowych, baz danych lub platform płatniczych bez ręcznego ponownego typowania. Plugin nadaje się do tego samego wysokiej jakości rdzenia OCC jak Asposa.ocR, zoptymalizowany dla układów faktury, tabel i par wartości podstawowych. Zmniejszy czas przetwarzania, minimalizuje błędy ludzkie i uzyska konsekwentne, dokładne wyniki na skalę.
Instalacja i ustawienie
Postępuj zgodnie z następującymi krokami, aby do Twojego projektu dodać Aspose.OCR Invoice do tekstu dla .NET:
- Instaluj za pośrednictwem NuGet lub pobierz pakiet z serwerów Aspose Instalacja .
- Konfiguruj mierzoną licencję na starcie aplikacji, aby uniknąć ograniczeń oceny Licencjonowanie według zużycia .
Przykład: rozpoznawanie faktur
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Funkcje i funkcje
Specjalny silnik OCR
- Dostosowane modele rozpoznawania dla drukowanych i fotografowanych faktur.
- Wysoka tolerancja dla różnych rozdzielczości, poziomów hałasu i kątów.
- Rozpoznawanie wielu języków i stylów cyfrowych w tym samym dokumencie.
Przetwarzanie i ulepszanie obrazu
- Automatyczne filtry odkurzania, odcięcia i binaryzacji w celu poprawy czytelności.
- Adaptywną granicę, która zachowuje linie faktur i granice tabeli.
- Ustawienia jasności i kontrastu do obsługi skanowania pod- lub nadeksponowanych.
Analiza i wykrywanie tabeli
- Automatyczna identyfikacja nagłówków, stopów, tabeli elementów linii i bloków podsumowania.
- Rozpoznawanie kolejek, kolumn i granic komórkowych, nawet wtedy, gdy linie rządzące są słabe lub brakuje.
- Ekstrakcja płytek (np. podtytuł pod elementem rzędu rodzicielskiego).
Kluczowa wartość pary ekstrakcji
- Konfigurowane szablony do nazw polowych map (np. „Liczba faktury”, „Total Due”) do wyników OCR.
- Wsparcie dla etykiet dynamicznych – wykrywa bliskość tekstu, a nie ścisłą zgodność szablonu.
- Ocena zaufania na polu, umożliwiając filtrację lub odtwarzanie elementów o niskiej niezawodności.
Eksport i integracja
- Format wyjścia: płaski tekst, JSON, XML, PDF, Word lub HTML.
- Wydarzenia pozwalają przechowywać surowe wyniki OCR przed serializacją.
- Wsparcie do przetwarzania batchów z kontrolami równoległymi dla dużych obciążeń roboczych.
Zarządzanie błędami i logowanie
- Szczegółowe wiadomości z wyjątkiem dla powszechnych trybów niepowodzeń (np. format obrazu bez wsparcia, problemy z licencją).
- Wbudowany interfejs logowania kompatybilny z popularnymi ramami .NET (Serilog, NLog i log4net).
- Polityka wycofania błędów przejściowych podczas rozdzielania pliku I/O lub pamięci.
Porady i najlepsze praktyki
- Pre-validated image resolution: dla najlepszej dokładności OCR, dostarczanie obrazów w lub powyżej 300 DPI.
- Użyj obrazów szary lub kolorowych - tylko wtyczki binarne mogą stracić cienkie linie stołowe.
- Utrzymuj granice zaufania w zależności od jakości danych; mniejsze granicy przyciągają więcej danych, ale mogą wymagać weryfikacji w dół.
- W przypadku bardzo dużych zestawów monitoruj wykorzystanie pamięci i dostosuj równoległość za pośrednictwem opcji przetwarzania wtyczki.
- Zdejmij funkcję szablonu wartości kluczowej, aby zamrozić oczekiwane układy faktury; w przypadku nieznanych układów powróć do genericznego wykrywania tabeli.
- Zawsze inicjalizuj Licencje Metrowane przed zastosowaniem jakichkolwiek metod OCR w celu uniknięcia oceny woda w trybie.
Postępując zgodnie z tymi wytycznymi i wykorzystując jego zdolności wskaźnikowe, Aspose.OCR Invoice to Text for .NET umożliwia budowanie niezawodnych, końcowo do końca rurociągów przetwarzania dokumentów – zmniejszając wysiłek ręczny i maksymalizując przepływ.