Aspose.OCR tablica za tekst za .NET
Aspose.OCR Tablica za tekst za .NET je moćan plugin koji omogućuje razvijalcima da izvlače tekst iz skeniranih ili snimljenih tablica s visokom točnostom. isporučujući napredne algoritme strojnog učenja i neuralne mreže, otkriva stolne strukture, povlači tekst na razini stanica i organizira sve u tražljive, uređujuće raspršene ploče ili tabularne strukture podataka.
Instaliranje i postavljanje
Da biste počeli, instalirajte Aspose.OCR Tablicu za tekst paket putem NuGeta ili preuzmite skup sa servera Asposa instalacija Priručnik za detaljne korake.Omogućiti punu funkcionalnost konfiguriranjem mjerenog licenciranja kako je opisano u Mjerena dozvola i dokumentacije.
Značajke i funkcionalnosti
Otkrivanje stola i prepoznavanje strukture
- Automatski otkriva granice tablice u skeniranim ili snimljenim slikama, čak i ako su stanice skijane, okretane ili neravnomjerno svijetle.
- Podržava višestruke i višestupanjske rasporedove, nestane tablice i različite veličine stanica.
- Pružuje hierarhijsku reprezentaciju redova i stanica za pojednostavnjenu post-procesiranje.
Cjelovita tekstna ekstrakcija
- Prepoznaje tekst u svakoj ćeliji pomoću naprednih OCR algoritama, čuvajući linije, kapitalizaciju i brojno formiranje.
- Rješava više jezika u jednoj tablici s konfiguriranim jezičnim prioritetima.
- Ispravlja poremećaje kao što su skijanje, nizak kontrast ili zvuk slike kako bi se povećala točnost.
Rekonstrukcija i izvoz
- Rekonstruira otkrivene tablice u .NET podatkovne strukture (npr. DataTable) ili ih izvozi u CSV/TSV formate.
- Stvara uređujuće datoteke (XLSX) koje se mogu otvoriti u programu Excel ili drugim alatima.
- Održavaju osnovnu formataciju stanica (aligniranje, granice) i koordinacije izvoza za napredne radne tokove.
Tražljivi i uredljivi rezultati
- Proizvodnja tražljivih tekstnih slojeva u PDF Izvoz, čineći sadržaj tablice indeksiran.
- Neosjetljivo se integrira s Aspose.Cells za napredne operacije spreadsheet kao što su formule i raspored.
- Omogućuje ugradnju izvučenog sadržaja u baze podataka ili downstream cijevi za obradu.
Učinkovitost i skalabilnost
- Optimaliziran za obradu velikih zbirki podataka s konfiguriranim širenjem i upravljanjem memorijom.
- Prijenos podataka slike izravno na OCR motor, minimizirajući I/O diska.
- Pružuje napredne pozive i tokene za otkazivanje za dugotrajne operacije.
Napredna prilagodba
- Podrška za područje interesa (ROI) za ograničavanje otkrivanja na određena područja za brže obradu.
- Konfigurirani ograničenja povjerenja za filtriranje rezultata niske povjerljivosti.
- Hooks za pre- i post-procesiranje (prilagođeni filtri, algoritmi iscjedka ili validatori).
Primjer: Izvlačenje teksta iz skeniranih ili fotografiranih tablica
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;
// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Uobičajeni slučajevi korištenja
- Uklanjanje strukturiranih podataka iz financijskih izvješća.
- Konvertirati skenirane obrasce i aplikacije u spreadsheets.
- Automatizacija zadaća uvođenja podataka pretvaranjem tabličnih slika u uređivajuće formate.
Savjeti i najbolje prakse
- Koristite slike s najmanje 300 DPI i dobar kontrast za najbolje rezultate.
- Pre-crop ili deskew slike za izolaciju stolnih područja.
- Preuzmite samo potrebne pakete jezika kako biste smanjili upotrebu memorije.
- Postavite granice povjerenja kako biste uravnotežili preciznost i uspomenu.
- Validirati obnovljene tablice protiv očekivanih shema prije uvoza u baze podataka.
Slijedom ovih smjernica i iskorištavanjem kapaciteta za prepoznavanje tablica, Aspose.OCR Table to Text za .NET pruža razvijalcima pouzdanu rješenje za pretvaranje skeniranih tablica u strukturiran, uređiv i pretraživ tekst.