Aspose.OCR Tablo metne Dönüştürme .NET için

Aspose.OCR Table to Text for .NET, geliştiricilerin yüksek hassasiyetle taran veya fotoğraflanan tablolarda metin çıkarmalarını sağlayan güçlü bir eklenti.Gelişmiş makine öğrenme algoritmaları ve sinir ağları kullanarak, tablo yapılarını tespit eder, hücresel düzeyde metni çekirir ve her şeyi arama yapabilen, düzenlenebilir spreadsheets veya tabul veri yapılarına düzenler.

Yükleme ve Setup

Başlamak için, NuGet aracılığıyla Aspose.OCR Tablo to Metin paketini yükleyin veya Assembly’i aspose sunucularından indirin Kurulum Detaylı adımlar için rehberlik.Tam işlevselliği ayarlayarak ölçülen lisanslandırma olarak açıklanır Ölçümlü Lisanslama Dokümanlık için.

Özellikler ve fonksiyonlar

Tablo Tanıtımı ve Yapısal Tanıma

  • Görüntülenen veya çekilen resimlerde tablo sınırlarını otomatik olarak tespit eder, hücreler çürümüş, döndürülmüş veya düzensiz bir şekilde aydınlatılmış olsa bile.
  • Çok çubuklu ve çok sütunlu düzenleri, gözenmiş tabloları ve farklı hücre boyutlarını destekler.
  • İşlem sonrası basitleştirilmesi için satır ve hücrelerin hiyerarşik bir temsilciliği sağlar.

Cell Text Ekstraksiyon

  • Her hücrenin içindeki metni gelişmiş OCR algoritmalarını kullanarak tanımlar, çizgi boşlukları, kapitalizasyon ve sayısal biçimlendirmeyi korur.
  • Bir tek tabloda birden fazla dil ile yapılandırılabilir dil öncelikleri ile işlenir.
  • Düzeltme, düşük kontrast veya görüntü gürültüsü gibi bozuklukları düzeltir, doğruluğu arttırır.

Tablo İnşaat ve İhracat

  • Keşfedilen tabloları .NET veri yapılarına (örneğin DataTable) yeniden yapılandırır veya bunları CSV/TSV biçimlerine ihraç eder.
  • Excel veya diğer araçlarda açılabilecek düzenlenebilir spreadsheet dosyaları (XLSX) oluşturur.
  • Temel hücre biçimlendirmesi (düzeltme, sınırlar) ve ileri çalışma akışları için ihracat koordinatları tutar.

Arama ve düzenlenebilir çıkış

  • Arama yapabilen metin katmanları üretir PDF için Tablo içeriği indekslenebilir hale getirir.
  • Formüller ve grafikler gibi gelişmiş spreadsheet operasyonları için Aspose.Cells ile karmaşık bir şekilde entegre edilir.
  • Çekilen içeriğin veritabanlarına veya düşük akımlı işleme borularına yerleştirilmesine izin verir.

performans ve ölçeklenebilirlik

  • Büyük veri kümelerinin batch işlenmesi için optimize edilmiş, yapılandırılabilir kaydırma ve hafıza yönetimi ile.
  • Görüntü verilerini doğrudan OCR motoruna aktarır, disk I/O’yu en aza indirir.
  • Uzun süreli işlemler için ilerleme çağrı geri dönüşleri ve iptal tokenleri sağlar.

Gelişmiş Customizasyon

  • Bölge-of-interest (ROI) desteği, daha hızlı işlem için belirli alanlara tespit sınırlaması.
  • Düşük güvenli sonuçları filtrelemek için ayarlanabilir güven sınırları.
  • İşlem öncesi ve sonrası (gönüllü filtreler, çerçeve algoritmaları veya doğrulayıcılar) için çubuklar).

Örnek: Scanlanmış veya fotoğraflanmış tablolardan metin çıkarma

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Yaygın Kullanım Durumları

  • Finansal raporlardan yapılandırılmış verileri çıkarmak.
  • Scanlanmış formları ve uygulamaları spreadsheets’e dönüştürmek.
  • Tablo görüntüleri düzenlenebilir biçimlere dönüştürerek veri giriş görevlerini otomatikleştirin.

İpuçları ve en iyi uygulamalar

  • En iyi sonuçlar için en az 300 DPI ve iyi kontrast ile görüntüleri kullanın.
  • Pre-crop veya deskew resimleri masa bölgelerini izole etmek için.
  • Hafıza kullanımını azaltmak için sadece gerekli dil paketlerini yükleyin.
  • Güven sınırlarını, doğruluğu ve hatırlatmayı dengelemek için ayarlayın.
  • Yeniden yapılandırılmış tabloları, veritabanlarına ithal etmeden önce beklenen şemalar karşısında doğrulayın.

Bu yönergelere uymak ve tablo tanıma yeteneğini kullanarak, Aspose.OCR Tablo to Text for .NET geliştiricilere taramalı tabloların yapılandırılmış, düzenlenebilir ve arama yapılabilir metinlere dönüştürülmesi için güvenilir bir çözüm sunar.

 Türkçe