Az ASPOSE.OCR számla a szöveghez .NET

Az ASPOSE.OCR számla a szöveghez .NET egy speciális plug-in célja, hogy egyszerűsítse a strukturált szöveg kivonását a szkennelt vagy fényképezett számlákból. A kulcsfontosságú lépések automatizálásával - kép előfeldolgozása, elrendezési elemzés és OCR - az eredményes adatokat közvetlenül a számviteli rendszerekbe, adatbázisokba vagy fizetési platformokra táplálhatja kézi átalakítás nélkül. Az plugin ugyanazt a magas színvonalú OCR magot használja, mint az ASPSE, amely optimalizálva van számlákat, táblákat és kulcsszavazási párokat. Csökkenti a feldolgozás idejét, minimalizálja az emberi hibát, és következetes, pontos eredményeket szerez.

Telepítés és telepítés

Kövesse ezeket a lépéseket, hogy hozzáadja Aspose.OCR számlát a .NET szöveghez a projekthez:

  • Telepítse a NuGet-en keresztül vagy töltse le a csomagot az Aspose szerverekről. részletes utasításokért lásd telepítés .
  • Állítsa be a mért licencet az alkalmazás indításakor, hogy elkerüljék az értékelési korlátozásokat Mérett licenc .

Példa: A számlák elismerése

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Jellemzők és funkciók

Számla-specifikus OCR motor

  • A nyomtatott és fényképezett számlák elismerési modelljei.
  • Magas tolerancia a különböző felbontásokhoz, zajszintekhez és csúszó szögekhez.
  • Többnyelv és digitális stílus azonos dokumentumban történő felismerése.

Képek előfeldolgozása és javítása

  • Automatikus leválasztás, lefedettség és bináris szűrők a olvashatóság javítása érdekében.
  • Adaptív küszöbérték, amely megőrzi a számlázási vonalakat és az asztali határokat.
  • A fényesség és a kontraszt beállítása az alatti vagy túlsúlyos szkennelések kezelésére.

Layout elemzés és asztali felismerés

  • Automatikus azonosítás a címke, lábfej, sor elemek táblázat, és összefoglaló blokkok.
  • A sorok, oszlopok és sejthatárok felismerése, még akkor is, ha az irányító vonalak gyengék vagy hiányoznak.
  • A nemes táblák kivonása (például a szubjektumok egy szülő vonal alatti elem alatt).

Kulcsfontosságú pár kivonás

  • Konfigurálható sablonok a térkép mezőnevekhez (például „Fontszám”, „Total Due”) az OCR eredményeihez.
  • A dinamikus címkék támogatása – a szigorú sablonok megfelelése helyett a szöveg közelségét észleli.
  • Bizalmi pontszámok mezőnként, lehetővé téve az alacsony bizalmi elemek szűrését vagy újrahasznosítását.

Export és integráció

  • A kimeneti formátumok: tiszta szöveg, JSON, XML, PDF, Word vagy HTML.
  • Az események megakadályozzák a nyers OCR eredményeket a serializáció előtt.
  • Batch feldolgozási támogatás párhuzamos vezérlővel a nagy mennyiségű munkafogyasztáshoz.

Hibaelhárítás és logging

  • Részletes kivételes üzenetek a közös hibás módokhoz (például nem támogatott képformátum, engedélyezési problémák).
  • A beépített naplózás interfész kompatibilis a népszerű .NET naplózási keretekkel (Serilog, NLog és log4net).
  • Az átmeneti hibák visszavonási politikája a fájl I/O vagy a memória elosztása során.

Tippek és legjobb gyakorlatok

  • Előre érvényesített képfelbontás: a legjobb OCR pontosság érdekében képeket szállít 300 DPI-nál vagy annál nagyobb mértékben.
  • Használjon szürke színű vagy színes képeket – csak a bináris bevitelek elveszíthetik a finom asztali vonalokat.
  • A bizalmi küszöbértékeket az adatok minőségével összhangban helyezzük el; az alacsonyabb határértékek több adatot kapnak, de lefelé érvényesítést igényelhetnek.
  • Nagyon nagy csomagok esetén figyelemmel kíséri a memória használatát és szabályozza a párhuzamot a plug-in feldolgozási lehetőségek segítségével.
  • A kulcsszó-érték-sablon funkciót a várt számlázási elrendezések befagyasztására; ismeretlen elhelyezések esetén visszatér a generikus asztali felismeréshez.
  • Mindig kezdeményezze a Mérsékelt Licencelést, mielőtt bármilyen OCR módszert alkalmazna, hogy elkerülje az értékelési mód vízjelzőit.

Ezeknek az iránymutatásoknak a megfelelésével és számla-központú képességeinek kihasználásával Aspose.OCR számlázás a szöveghez .NET lehetővé teszi, hogy megbízható, végső-végső dokumentumfeldolgozó csővezetékeket építsen – minimalizálva a kézi erőfeszítést és a maximális átjárhatóságot.

 Magyar