Aspose.OCR Taulukko tekstiin .NET

Aspose.OCR Table to Text for .NET on tehokas plugin, jonka avulla kehittäjät voivat poistaa tekstiä skannatuista tai kuvattuista taulukoista korkealla tarkkuudella. Edistyneiden koneoppimisen algoritmien ja hermoston verkkojen hyödyntämisessä se havaitsee taulukon rakenteet, vetää solutason tekstin ja järjestää kaiken hakukelpoisiin, muokattavissa oleviin levytiedostoihin tai tabelitietorakenteisiin.

Asennus ja asennus

Aloita, asenna Aspose.OCR Table to Text -paketti NuGetin kautta tai lataa kokoelma Asposen palvelimilta asennuksen Ohje yksityiskohtaisille askeleille.Mahdollistaa täydellinen toimivuus määrittämällä mitattu lisenssi sellaisena kuin se on kuvattu mitattu lisenssi ja dokumentaatiota.

Ominaisuudet ja toiminnot

Taulukon havaitseminen ja rakenteen tunnistaminen

  • Se havaitsee automaattisesti taulukon rajat skannatuissa tai kuvattuissa kuvissa, vaikka solut olisivat heitetyitä, pyöristettyjä tai epätasaisesti maalattuja.
  • Se tukee monikerroksisia ja monikokoisia asetuksia, nestetyt taulukot ja vaihtelevat solujen koot.
  • Tarjoaa sarjojen ja solujen hierarkisen edustuksen yksinkertaistettuun jälkeiseen käsittelyyn.

Tekstirakenteet Cell Extraction

  • Tunnistaa tekstin kunkin solun sisällä käyttämällä kehittyneitä OCR-algoritmeja, säilyttäen linjan murteet, kapitalisointi ja numerinen muotoilu.
  • Käsittele useita kieliä yhdessä taulukossa, jossa on määritettävissä olevia kieliprioriteetteja.
  • Korjaa vääristymät, kuten piilot, alhainen kontrasti tai kuvan melu parantaa tarkkuutta.

Taulukon rakentaminen ja vienti

  • Palauttaa havaitut taulukot .NET-tietorakenteisiin (esim. DataTable) tai viedä ne CSV/TSV-muodoksiin.
  • Luo muokattavissa olevia levytiedostoja (XLSX), jotka voidaan avata Excelissä tai muissa työkaluissa.
  • Säilyttää perus solujen muotoilu (liitäntä, rajat) ja vienti koordinaatteja kehittyneille työvälineille.

Haku ja säädettävissä oleva tulos

  • Tuottaa etsimättömät tekstilaatikot PDF tuonti, jolloin taulukon sisältö on indeksoitava.
  • Se integroi sujuvasti Aspose.Cellin kanssa edistyksellisiin levytiedostoihin, kuten kaavioihin ja grafiikkaan.
  • Se mahdollistaa saatujen sisältöjen sisällyttämisen tietokantoihin tai alhaiseen käsittelypyyhkeisiin.

suorituskyky ja skalaavuus

  • Optimoitu suurien tietokoneiden keräysprosessille, jossa on määritettävissä olevassa tiivistyksessä ja muistin hallinnassa.
  • Virtaa kuvan tiedot suoraan OCR-moottoriin, minimoimalla levyn I/O.
  • Tarjoaa edistyksellisiä puheluita ja peruuttamistoimia pitkän aikavälin toiminnoille.

Edistyksellinen mukauttaminen

  • Region-of-interest (ROI) tuki rajoittaa havaitsemista tietyille alueille nopeamman käsittelyn varmistamiseksi.
  • Määritetyt luottamusrajat suodattaa alhaisen luottamuksen tuloksia.
  • Ennakko- ja jälkeinen käsittely (tyypilliset suodattimet, levytysalgoritmit tai validoijat).

Esimerkki: Vähennä tekstiä skannatuista tai kuvattuista taulukoista

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Yleisiä käyttötapoja

  • Rakenteellisten tietojen tuottaminen tilinpäätöksistä.
  • Skannattujen lomakkeiden ja sovellusten muuntaminen levylle.
  • Tietojen tallennustyöt automaattisesti muuntamalla taulukon kuvia muokkaaviksi muodoiksi.

Vinkkejä ja parhaita käytäntöjä

  • Käytä kuvia, joissa on vähintään 300 DPI ja hyvä kontrasti parhaan tuloksen saavuttamiseksi.
  • Pre-crop tai deskew kuvia eristää pöydän alueet.
  • Lataa vain tarvittavat kielipaketit muistin käytön vähentämiseksi.
  • Suorita luottamuksen rajat tasapainottamaan tarkkuutta ja muistamista.
  • Validoi uudelleenrakennetut taulukot odotettujen järjestelmien vastaisesti ennen tuontia tietokantoihin.

Noudattamalla näitä ohjeita ja hyödyntämällä taulukon tunnistamiskykyä, Aspose.OCR Table to Text for .NET tarjoaa kehittäjille luotettavan ratkaisun skannattujen taulukoiden muuntamiseen rakenteelliseksi, muokattavaksi ja etsimättömäksi tekstiksi.

 Suomi