Aspose.OCR Jadual untuk teks untuk .NET

Aspose.OCR Table to Text untuk .NET adalah plugin yang berkuasa yang membolehkan pemaju untuk mengekstrak teks daripada jadual yang disemak atau difoto dengan ketepatan yang tinggi.Mengeluarkan algoritma pembelajaran mesin canggih dan rangkaian saraf, ia mendeteksi struktur meja, menarik teks peringkat sel, dan mengatur segala-galanya ke dalam pencarian, boleh diedit spreadsheets atau struktur data tabel.

Pemasangan dan Setup

Untuk memulakan, anda boleh memasang pakej Aspose.OCR Table to Text melalui NuGet atau muat turun set daripada pelayan ASPOSE Installation Panduan untuk langkah-langkah terperinci.Membolehkan fungsi penuh dengan mengkonfigurasi lesen yang diukur seperti yang dinyatakan dalam Lisensi Pengukuran Dokumen yang.

Ciri-ciri dan fungsi

Pengesanan Jadual dan Pengiktirafan Struktur

  • Ia secara automatik mengesan sempadan jadual dalam imej yang dipindai atau dipotret, walaupun sel-sel dikelilingi, berputar, atau tidak seimbang bercahaya.
  • Ia menyokong tataletak pelbagai tiang dan pelbagai lajur, jadual bergelombang, dan saiz sel yang berbeza.
  • Menyediakan perwakilan hierarki baris dan sel untuk pemprosesan post yang disederhanakan.

Pengeluaran teks sel

  • Mengiktiraf teks dalam setiap sel menggunakan algoritma OCR canggih, mengekalkan garis pecah, kapitalisasi, dan pemformatan nombor.
  • Mengendalikan pelbagai bahasa dalam satu jadual dengan keutamaan bahasa yang boleh dikonfigurasi.
  • Membetulkan kekeliruan seperti kerosakan, kontras rendah, atau bunyi imej untuk meningkatkan ketepatan.

Pembinaan semula dan eksport

  • Ia membina semula jadual yang dikesan ke dalam struktur data .NET (contohnya, DataTable) atau mengeksportnya ke format CSV/TSV.
  • Mencipta fail spreadsheet yang boleh diedit (XLSX) dan boleh dibuka dalam Excel atau alat lain.
  • Mengekalkan format sel asas (alignment, sempadan) dan koordinat eksport untuk aliran kerja lanjutan.

Hasil yang boleh dicari dan diedit

  • Mencipta lapisan teks yang boleh dicari dalam Perkhidmatan PDF mengeksport, menjadikan kandungan jadual indexable.
  • Ia mengintegrasikan dengan teliti dengan Aspose.Cells untuk operasi spreadsheet lanjutan seperti formula dan carta.
  • Membolehkan memasukkan kandungan yang diekstrak ke dalam pangkalan data atau paip pemprosesan downstream.

prestasi dan scalability

  • Dioptimumkan untuk pemprosesan batch set data besar dengan pengaturcaraan yang boleh dikonfigurasi dan pengurusan memori.
  • Mengalirkan data imej secara langsung ke enjin OCR, meminimumkan cakera I/O.
  • Menyediakan kemajuan panggilan balik dan token pembatalan untuk operasi jangka panjang.

Penyesuaian lanjutan

  • Kawasan faedah (ROI) menyokong untuk mengehadkan pengesanan kepada kawasan tertentu untuk pemprosesan yang lebih cepat.
  • Batas keyakinan yang boleh disesuaikan untuk menapis hasil kepercayaan rendah.
  • Hooks untuk pra- dan selepas pemprosesan (filter yang disesuaikan, algoritma deskew, atau validator).

Contoh: Mengekstrak teks daripada jadual yang disemak atau dipotret

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Kasus Penggunaan Umum

  • Mengekstrak data berstruktur daripada laporan kewangan.
  • Menukar borang dan aplikasi yang disemak ke dalam skrin.
  • Mengautomatikkan tugas kemasukan data dengan mengubah imej jadual menjadi format yang boleh diedit.

Tips dan Amalan Terbaik

  • Gunakan imej dengan sekurang-kurangnya 300 DPI dan kontras yang baik untuk hasil yang terbaik.
  • Pre-crop atau deskew imej untuk mengisolasi kawasan meja.
  • Hanya memuatkan pakej bahasa yang diperlukan untuk mengurangkan penggunaan memori.
  • Letakkan batas kepercayaan untuk menyeimbangkan ketepatan dan kenangan.
  • Mengesahkan jadual yang diubahsuai terhadap skim yang dijangkakan sebelum mengimport ke pangkalan data.

Dengan mengikuti garis panduan ini dan memanfaatkan keupayaan pengenalan jadual, Aspose.OCR Table to Text for .NET menyediakan pemaju dengan penyelesaian yang boleh dipercayai untuk menukar papan yang disemak ke dalam teks yang terstruktur, boleh diedit, dan boleh dicari.

 Melayu