Aspose.OCR Табела за текст за .NET

Aspose.OCR Table to Text for .NET је моћан плугин који омогућава програмерима да екстрактирају текст из скенираних или фотографисаних табела са високом прецизношћу. ослобађајући напредне алгоритме машинског учења и неуралне мреже, открива структуре стола, привлачи текст на нивоу ћелије и организује све у претраживајуће, уређивајући шипке или табуларне структуру података.

Инсталација и подешавање

Да бисте почели, инсталирајте Аппосе.ОЦР табелу до тексту пакету преко НуГет или преузмите скуп са АППосе сервера Инсталација Руководство за детаљне кораке.Омогућава пуну функционалност конфигурисањем мереног лиценцирања као што је описано у Метеран лиценцирање То је документација.

Карактеристике и функције

Детекција стола и препознавање структуре

  • Аутоматски открива табелне границе у скенираним или фотографисаним сликама, чак и ако су ћелије скраћене, ротиране или неједнако осветљене.
  • Подржава мулти-роу и мултијалум распореде, нестене табеле и различите величине ћелија.
  • Обезбеђује хијерархијску репрезентацију редова и ћелија за поједностављено пост-процесирање.

Екстракција ћелијског текста

  • Препознава текст у свакој ћелији користећи напредне ОЦР алгоритме, чувајући линије прекида, капитализацију и бројну форматирање.
  • Управља више језика у једној табели са конфигурисаним језичким приоритетима.
  • Исправља деформације као што су скев, низак контраст или звук слике како би се повећала тачност.

Реконструкција и извоз стола

  • Реконструише откривене табеле у .NET структуре података (на пример, DataTable) или их извози у CSV/TSV формати.
  • Генерише уређујуће датотеке шипке (XLSX) које се могу отворити у Екцелу или другим алатима.
  • Одржава основно ћелијско форматирање (сагласност, границе) и извозни координати за напредне радне токове.

Тражећи и уређени излаз

  • Производи тражене текстуалне слојеве у ПДФ извозе, чинећи садржај табеле индексираним.
  • Интегрише се беспрекорно са Aspose.Cells за напредне операције ширења као што су формуле и графике.
  • Омогућава убацивање извученог садржаја у базе података или нуклеарне цеви за обраду.

Резултати и скалабилност

  • Оптимизована за обраду великих сетова података са конфигурисаним тражењем и управљањем меморијом.
  • Преноси податке слике директно на ОЦР мотор, минимизирајући диск И/О.
  • Обезбеђује напредне позиве и токене за укидање за дуготрајне операције.

напредне прилагођавања

  • Регион-оф-интерес (РОИ) подршка за ограничавање откривања на одређене области за бржу обраду.
  • Конфигурисане границе поверења да би се филтрирали резултати ниске поверење.
  • Кључеви за пре- и пост-процесирање (прилагођени филтери, алгоритми дескева или валидатори).

Пример: Екстракт текста из скенираних или фотографисаних табела

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Уобичајени случајеви

  • Извлачење структурираних података из финансијских извештаја.
  • Претварање скенираних обрасца и апликација у шипке.
  • Аутоматизација задатака за улазак података претварањем слике табеле у уређујуће формате.

Савети и најбоља пракса

  • Користите слике са најмање 300 ДПИ и добар контраст за најбоље резултате.
  • Pre-crop ili deskew slike za izolaciju stolnih regija.
  • Преузмите само потребне језичке пакете како бисте смањили употребу меморије.
  • Tuni granice poverenja kako bi se uravnotežila preciznost i sećanje.
  • Валидирајте реконструисане табеле против очекиваних схема пре увоза у базе података.

Следећи ове упутства и искоришћењем својих капацитета за препознавање табела, Aspose.OCR Table to Text for .NET пружа програмерима поуздано решење за конверзију скенираних табла у структурирани, уређени и претраживајући текст.

 Српски