Aspose.OCR Fotografija za tekst za .NET
Aspose.OCR Photo to Text za .NET omogućuje razvijalcima da izvlače tekst iz fotografija snimljenih kamerama ili pametnim telefonima.Ugrađen na dokazanom Aspoe.ocR motoru, ovaj plugin primjenjuje napredne predprocesne filtre – kao što su korekcija rotacije, kompenzacija poremećaja i suzbijanje buke – kako bi se pružila visoka točnost prepoznavanja čak i na skijanim, niskim kontrastom ili zvučnim slikama.
Instaliranje i postavljanje
Početak je vrlo jednostavan:
- Instalirajte Aspose.OCR paket putem NuGeta ili s distributivnog uređaja koji je preuzeta.See instalacija Za detaljne upute.
- Konfigurirajte mjerenu licenciju na startup-u kako biste otključili punu funkcionalnost.upućuje se na Mjerena dozvola Za nastavak koraka.
Primjer: Izvlačenje teksta iz fotografija
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Značajke i funkcionalnosti
Napredni preprocesorski filtri
- Rotacija i Skew Korekcija : Automatski izravno prikazuje snimljene fotografije.
- Distortion Compensation : ispravlja objektivno indukirane artefakte i perspektive.
- Smanjenje buke : Smanjuje zglobove, prah i kompresijske materijale.
- Kontrast i prilagodba svjetlosti : optimizira osvijetljenje za dim ili preizložene slike.
Robustni tekstovni prepoznavni motor
- Mnogobrojni OCR (latinski, cirilski, arapski i CJK skript).
- Font-agnostička detekcija koja podržava tiskano tekst, potpisivanje i skeniranje.
- Automatsko segmentaciju skriptova na mješovitim stranicama.
- Prepoznavanje brojeva, simbola i točke s konfiguracijskim ograničenjima.
Layout analiza i segmentacija
- Automatsko otkrivanje tekstnih blokova u odnosu na grafike ili tablice.
- Segmentacija stolpca i linije čuva prirodni red čitanja.
- OCR-a za ciljanje određenih regija.
Izvodni formati i ekstrakcija podataka
- izvoz ravnog teksta, strukturiranih predmeta, ili JSON Koordinacije za kutiju granica.
- Obratite line-by-line ocjene povjerenja za validaciju.
- Generate PDF ili izlaze iz teksta izravno za downstream upotrebu.
Batch i paralelno obradu
- Paralelno prepoznavanje pomoću .NET async/await.
- Odluka o upravljanju velikim radnim opterećenjima.
- Potpora za otkazivanje dugotrajnih zadataka.
Korištenje i proširenje
- Definicija prilagođenih filtracijskih cijevi.
- Dodajte rječnike ili rečenice kako biste poboljšali točnost.
- Priključite se događajima priznavanja za prijavu ili međusobnu inspekciju.
Tuning djelovanja
- Prilagoditi rezoluciju i boju dubine za ravnotežu između brzine i točnosti.
- Cache pre-procesirane buffere kada radite s ponavljanim šablona.
- Profilne faze cijevi za izolaciju bočica.
Savjeti i najbolje prakse
- Pre-izabrani ili uzgoj regije interesa za minimiziranje vremena obrade.
- Ispitivanje parametara filtera na reprezentativnim uzorcima prije lansiranja.
- Koristite ocjene povjerenja za izgradnju padova ili ljudskih validacijskih tokova.
- Za mobilne fotografije, osigurajte ispravno osvjetljenje i kontrast pozadine.
- Monitoriranje upotrebe memorije s batchom; primjenjujte tokene za otkazivanje gdje je to potrebno.
- Kombinirajte JSON izvoz s validacijskim uslugama kako biste izgradili čvrste podatkovne cijevi.
Često postavljana pitanja
**Je li potrebno određivati jezik?**Podrazumevano, plugin automatski otkriva mnoge jezike. međutim, izričito postavljanje jezika poboljšava točnost za skript kao što su Cyrillic, kineski, ili Hindi.
**Koji su formati podržani?**JPEG, PNG, TIFF, PDF, i druge popularne formate iz skenerima ili kamerama. Rezultati se mogu izvoziti kao ravni tekst, HTML, Word, pdf, JSON, ili XML.
**Kako mogu postići najbolje rezultate?**Koristite visokokvalitetne slike s skenerima ili modernim kamerama.Ugrađeni filtri poboljšavaju kvalitetu slike prije prepoznavanja.