ASPOSE.OCR táblázat a szöveghez .NET

Az Aspose.OCR Table to Text for .NET egy erős plugin, amely lehetővé teszi a fejlesztők számára, hogy kivonják a szöveget a szkennelt vagy fényképezett táblákból nagy pontossággal. A fejlett gépi tanulási algoritmusok és ideghálózatok felszerelése, az asztali struktúrák kimutatása, a cellas szintű szöveg vonzása és minden megtalálható, szerkeszthető lapokba vagy tabuláris adatokba szerveződik.

Telepítés és telepítés

Ahhoz, hogy elinduljon, telepítse az Aspose.OCR Table to Text csomagot a NuGet-en keresztül, vagy töltse le az Assembly-t az ASPOSE szerverekről telepítés Részletes lépések útmutatója.A teljes funkcionalitás lehetővé tétele a mért licenc konfigurálásával, amint azt a Mérett licenc A dokumentáció.

Jellemzők és funkciók

Az asztali felismerés és a szerkezet felismertése

  • Automatikusan kimutatja az asztali határokat a szkennelt vagy fényképezett képekben, még akkor is, ha a sejteket szétválasztják, forgatják vagy egyenlőtlenül megvilágítják.
  • Támogatja a többszögű és több oszlopos elrendezéseket, a nemes táblákat és a különböző sejtméreteket.
  • Biztosítja a sorok és sejtek hierarchikus képviseletét az egyszerűsített post-feldolgozáshoz.

Cél szöveg kivonat

  • Elismeri a szöveget minden sejtben a fejlett OCR algoritmusok segítségével, megőrizve a vonal szakadékokat, a kapitalizációt és a numerikus formázást.
  • Több nyelvet kezel egy táblázatban, konfigurálható nyelvi prioritásokkal.
  • Korrigálja a torzításokat, mint például a csúszás, alacsony kontraszt, vagy a kép zaj, hogy növelje a pontosságot.

Újjáépítés és export

  • Újjáépíti az észlelt táblákat .NET adatstruktúrákba (például DataTable) vagy exportálja őket CSV/TSV formátumokba.
  • A szerkeszthető lapfájlok (XLSX) létrehozása, amelyeket az Excelben vagy más eszközökben lehet megnyitni.
  • Megtartja az alapvető sejtformátumot (alignálás, határok) és export koordinátákat a fejlett munkafolyamatok.

Kereshető és szerkeszthető eredmény

  • Kereshető szöveges rétegeket hoz létre PDF A táblázat tartalmának indexálása.
  • Integrálhatatlanul az Aspose.Cells-vel a fejlett adathordozó műveletekhez, mint például a képletek és a grafikonok.
  • Lehetővé teszi a kivont tartalmak adatbázisokba vagy alacsony áramú feldolgozási csővezetékekbe történő beépítését.

teljesítmény és skálázhatóság

  • Nagy adatkészletek csomagkezelésére optimalizálva konfigurálható csavarozással és memóriamenedzsmentgel.
  • Áramlik a képadatok közvetlenül az OCR motorhoz, minimalizálva az I/O lemezt.
  • Javasolja a progress callbacks és törlés tokensek hosszú távú műveletekhez.

fejlett személyre szabás

  • Region-of-interest (ROI) támogatás, hogy korlátozza a felismerést bizonyos területekre a gyorsabb feldolgozás érdekében.
  • Konfigurálható bizalmi küszöbök az alacsony bizalom eredményeinek szűrésére.
  • A feldolgozás előtti és utáni szűrők (könnyű szűrési szálak, lemez algoritmusok vagy validátorok).

Példa: Szöveg kivonása szkennelt vagy fényképezett táblákból

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Általános használati esetek

  • A strukturált adatok kivonása a pénzügyi jelentésekből.
  • A szkennelt formanyomtatványok és alkalmazások átalakítása lapokká.
  • Az adatbeviteli feladatok automatizálása táblázati képek szerkeszthető formátumokká történő átalakításával.

Tippek és legjobb gyakorlatok

  • Használjon legalább 300 DPI képet és jó kontrasztot a legjobb eredmények érdekében.
  • Pre-crop vagy deskew képek, hogy elszigetelje az asztali régiók.
  • Csak a szükséges nyelvi csomagokat töltse fel a memória használatának csökkentése érdekében.
  • A bizalom küszöbét a pontosság és az emlékezés kiegyensúlyozására helyezzük el.
  • Ellenőrizze a felújított táblákat a várt rendszerekkel szemben, mielőtt az adatbázisokba importálná.

Ezeket az iránymutatásokat követve és táblázatfelismerési képességeinek kihasználásával az Aspose.OCR Table to Text for .NET megbízható megoldást kínál a fejlesztőknek a szkennelt tábliák strukturált, szerkeszthető és kereshető szövegekké történő átalakítására.

 Magyar