Aspose.OCR Tabel ke Teks untuk .NET

Aspose.OCR Table to Text for .NET adalah plugin yang kuat yang memungkinkan pengembang untuk mengekstrak teks dari tabel yang dipindai atau dipotret dengan ketepatan tinggi.Menghapus algoritma pembelajaran mesin lanjutan dan jaringan saraf, itu mendeteksi struktur tabel, menarik teks tingkat sel, dan mengatur semuanya ke dalam pencarian, editable spreadsheets atau tabel data structures.

Instalasi dan Setup

Untuk memulai, instalasi paket Aspose.OCR Table to Text melalui NuGet atau muat turun assembly dari server Asposa Instalasi Panduan untuk langkah-langkah terperinci.Memungkinkan fungsi penuh dengan mengkonfigurasi lisensi yang diukur seperti yang dijelaskan dalam Lisensi Terukur dan dokumentasi.

Fitur dan Fungsi

Deteksi tabel dan pengenalan struktur

  • Secara otomatis mengidentifikasi batas-batas tabel dalam gambar yang dipindai atau difotografasikan, bahkan jika sel-sel terukir, berputar, atau tidak seimbang.
  • Menyokong tataletak multi-ro dan multi kolom, tabel berlapis, dan ukuran sel yang berbeda.
  • Menyediakan representasi hierarki dari baris dan sel untuk post-processing yang disederhanakan.

Ekstraksi teks sel

  • Mengidentifikasi teks dalam setiap sel menggunakan algoritma OCR canggih, mempertahankan garis pecah, kapitalisasi, dan pemformatan numerik.
  • Mengendalikan beberapa bahasa dalam satu tabel dengan keutamaan bahasa yang dapat dikonfigurasi.
  • Correct distorsi seperti skum, kontras rendah, atau bunyi gambar untuk meningkatkan keakuratan.

Rekonstruksi dan Ekspor

  • Rekonstruksi tabel yang ditemukan ke dalam struktur data .NET (misalnya DataTable) atau mengekspornya ke format CSV/TSV.
  • Menghasilkan file spreadsheet yang dapat diedit (XLSX) yang bisa dibuka dalam Excel atau alat lain.
  • Memelihara format sel dasar (alignment, batas) dan koordinat ekspor untuk aliran kerja lanjutan.

Hasil yang dapat dicari dan diedit

  • Menghasilkan lapisan teks yang dapat dicari di PDF mengekspor, membuat konten tabel terindeks.
  • Mengintegrasikan dengan aman dengan Aspose.Cells untuk operasi spreadsheet lanjutan seperti formula dan grafis.
  • Memungkinkan memasukkan konten yang diekstrak ke dalam database atau pipa pemrosesan downstream.

Performa dan Scalability

  • Optimisasi untuk pemrosesan batch dari set data besar dengan pengaturan yang dapat dikonfigurasi dan manajemen memori.
  • Stream data gambar langsung ke mesin OCR, meminimalisir cakera I/O.
  • Menyediakan callbacks kemajuan dan token pembatalan untuk operasi jangka panjang.

Customisasi lanjutan

  • Regional-of-interest (ROI) mendukung untuk membatasi deteksi ke area tertentu untuk pemrosesan lebih cepat.
  • Konfigurasi batas keyakinan untuk menapis hasil yang rendah.
  • Hooks untuk pra- dan post-processing (filter tersuai, algoritma deskew, atau validator).

Contoh: Mengekstrak teks dari tabel yang dipindai atau dipotret

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Kasus Penggunaan Umum

  • Mengekstrak data terstruktur dari laporan keuangan.
  • Mengkonversi formulir dan aplikasi yang dipindai menjadi spreadsheets.
  • Mengautomatikkan tugas input data dengan mengubah gambar tabel menjadi format yang dapat diedit.

Tips dan Praktik Terbaik

  • Gunakan gambar dengan setidaknya 300 DPI dan kontras yang baik untuk hasil terbaik.
  • Pre-crop atau deskew gambar untuk mengisolasi area tabel.
  • Hanya memuat paket bahasa yang diperlukan untuk mengurangi penggunaan memori.
  • Gunakan batas kepercayaan untuk menyeimbangkan ketepatan dan mengingat.
  • Validasi tabel yang diubahsuai terhadap skema yang diharapkan sebelum mengimpor ke database.

Dengan mengikuti garis panduan ini dan memanfaatkan kemampuan pengenalan tabel, Aspose.OCR Table to Text for .NET menyediakan pengembang dengan solusi yang dapat diandalkan untuk mengubah tabel yang dipindai menjadi teks yang terstruktur, bisa diedit, dan dapat dicari.

 Indonesia