Aspose.OCR Invoice ke Teks untuk .NET
Aspose.OCR Invoice to Text for .NET adalah plug-in khusus yang dirancang untuk menyederhanakan ekstraksi teks terstruktur dari invois yang dipindai atau dipotret. Dengan mengautomatikkan langkah-langkah kunci—pre-processing gambar, analisis layout, dan OCR—Anda dapat menyimpan data yang dihasilkan langsung ke sistem akuntansi, database, atau platform pembayaran tanpa re-typing manual. Plugin memanfaatkan inti oCR berkualitas tinggi yang sama seperti Asposa.ocR, dioptimalkan untuk tataletak rekening, tabel, serta pasangan nilai kunci. Anda akan mengurangi waktu pemrosesan, meminimalisir kesalahan manusia dan mendapatkan hasil yang konsisten, tepat pada skala.
Instalasi dan Setup
Ikuti langkah-langkah ini untuk menambahkan Aspose.OCR Invoice ke Text for .NET ke proyek Anda:
- Instal melalui NuGet atau download paket dari server Aspose. untuk petunjuk rinci, lihat Instalasi .
- Mengkonfigurasi lisensi terukur pada startup aplikasi untuk menghindari pembatasan evaluasi Lisensi Terukur .
Contoh: Mengidentifikasi Invois
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Fitur dan Fungsi
Fitur spesifik OCR Engine
- Model pengenalan yang disesuaikan untuk invois cetak dan difoto.
- Toleransi tinggi untuk resolusi yang bervariasi, tingkat kebisingan, dan sudut tersumbat.
- Pengenalan beberapa bahasa dan gaya digital dalam dokumen yang sama.
Image Preprocessing & Peningkatan
- Automatic deskewing, deskle, dan binarization filter untuk meningkatkan pembacaan.
- Adaptif sempadan yang mempertahankan garis invois dan batas tabel.
- Penyesuaian kecerahan dan kontras untuk menangani pemindaian bawah atau berlebihan.
Layout Analysis & Deteksi Jadual
- Identifikasi otomatis header, footer, tabel item baris, dan blok ringkasan.
- Pengenalan baris, kolom, dan batas sel, bahkan ketika garis penguasaan lemah atau hilang.
- Mengekstrak tabel yang tertanam (misalnya, sub item di bawah item garis ibu).
Tag: nilai ekstraksi pasangan
- Templat yang dapat dikonfigurasi untuk nama medan peta (misalnya, “Nombor Invoice”, “Total Due”) untuk hasil OCR.
- Dukungan untuk label dinamis – mendeteksi kedekatan teks bukannya persamaan template yang ketat.
- Penilaian kepercayaan per lapangan, memungkinkan Anda untuk menapis atau memodifikasi item yang kurang percaya diri.
Eksport & Integrasi
- Format output: teks rata, JSON, XML, PDF, Word, atau HTML.
- Event hooks untuk menangkap hasil OCR mentah sebelum serialisasi.
- Dukungan pemrosesan batch dengan kontrol paralelis untuk beban kerja volume tinggi.
Kesalahan Pengelolaan & Logging
- Pesan pengecualian terperinci untuk mode kegagalan umum (misalnya, format gambar yang tidak didukung, masalah lisensi).
- Interface log masuk yang kompatibel dengan rangka kerja log .NET populer (Serilog, NLog dan log4net).
- Kebijakan pengembalian untuk kesalahan transisi selama file I/O atau pengagihan memori.
Tips dan Praktik Terbaik
- Resolusi gambar pre-validated: untuk ketepatan OCR terbaik, memberikan gambar pada atau lebih dari 300 DPI.
- Gunakan gambar berwarna-warni atau abu-abu – hanya input biner dapat kehilangan garis meja yang halus.
- Tingkatkan batas kepercayaan sesuai dengan kualitas data Anda; batas yang lebih rendah menangkap lebih banyak data tetapi mungkin memerlukan validasi downstream.
- Untuk paket yang sangat besar, memantau penggunaan memori dan menyesuaikan paralelisme melalui opsi pemrosesan plug-in.
- Tingkatkan fitur template nilai kunci untuk membekukan layout invoice yang diharapkan; untuk layouts yang tidak diketahui, jatuh kembali pada deteksi tabel generik.
- Selalu memulai Metered Licensing sebelum memanggil metode OCR apa pun untuk menghindari penilaian-mode watermark.
Dengan mengikuti garis panduan ini dan memanfaatkan kapasitas invoice-centric, Aspose.OCR Invoices to Text for .NET memungkinkan Anda untuk membangun pipa pemrosesan dokumen yang dapat diandalkan, end-to-end – meminimalisir usaha manual dan maksimalkan output.