ASPOSE.OCR nuotrauka į tekstą .NET
Aspose.OCR Photo to Text for .NET leidžia kūrėjams ištraukti tekstą iš fotoaparatų ar išmaniųjų telefonų fotografijų. pastatytas ant įrodytos „Aspose.“ OCR variklio, šis priedas naudoja pažangius prieš apdorojimo filtrus, tokius kaip rotacijos korekcija, iškraipymo kompensavimas ir triukšmo slopinimas, kad būtų užtikrintas aukštos tikslumo atpažinimas net ir sklandžiomis, mažai kontrastinėmis ar triukiomis nuotraukomis.
Įdiegimas ir nustatymas
Pradėti yra paprasta:
- Įdiegti Aspose.OCR paketą per NuGet arba iš atsisiunčiamo platintojo.See Installation Išsamios instrukcijos.
- Nustatykite matuotą licenciją „Startup“, kad atvertumėte visą funkcionalumą.Atkreipkite dėmesį Išmatuota licencija Įdiegimo žingsniai.
Pavyzdys: tekstas iš nuotraukų
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Savybės ir funkcijos
Išplėstiniai perdirbimo filtrai
- Rotacija ir Skew korekcija : automatiškai ištaisyti įtemptas nuotraukas.
- Distortion Compensation : Koreguoja ląstelės sukeltus artefaktus ir perspektyvą.
- triukšmo mažinimas : slopina spindulius, dulkes ir kompresinius daiktus.
- Kontrastinis ir ryškumo koregavimas : optimizuoja apšvietimą, skirtą tuščioms arba pernelyg išdėstytoms nuotraukoms.
Stiprus teksto atpažinimo variklis
- Daugiakalbystės OCR (latinų, cirilinių, arabų ir CJK raštai).
- Fontų diagnostikos detekcija, palaikanti spausdintą tekstą, signalizavimą ir skenavimus.
- Automatinis scenarijų segmentacija mišrių kalbų puslapiuose.
- Numerų, simbolių ir taškų pripažinimas su konfigūruojamais ribomis.
Layout analizė ir segmentacija
- Automatinis teksto blokų aptikimas prieš grafiką ar lenteles.
- Stulpelio ir eilutės segmentacija išsaugo natūralią skaitymo tvarką.
- Zona grindžiama OCR konkrečioms regionams nukreipti.
Išleidimo formatas ir duomenų ekstrakcija
- eksportuoti plokščią tekstą, struktūrizuotus objektus arba JSON Su „Bunding Box“ koordinatomis.
- Retrieve line-by-line pasitikėjimo rezultatai patvirtinimui.
- Generate PDF arba teksto išėjimai tiesiogiai žemyniniam naudojimui.
Batch ir paralelių apdorojimas
- Paralelinis atpažinimas naudojant .NET async/await.
- Kviejaus valdymas didelio masto darbo apkrovoms.
- Atšaukimo parama ilgalaikiams užduotims.
Pritaikymas ir išplėstumas
- Nustatykite pritaikytus filtrų vamzdžius.
- Pridėkite žodynus ar žodyną, kad pagerintumėte tikslumą.
- Paspauskite į atpažinimo įvykius registravimui ar tarpiniam patikrinimui.
Veiksmų tunas
- Pritaikykite rezoliuciją ir spalvų gylį, kad būtų galima subalansuoti greitį ir tikslumą.
- Atslėpti iš anksto apdorotus buferus, kai dirbate su pakartotinėmis šablonomis.
- Profilinių vamzdžių etapų, skirtų buteliukams izoliuoti.
Patarimai ir geriausios praktikos
- Iš anksto parinkti arba pasėlių interesų regionai, siekiant sumažinti apdorojimo laiką.
- Išbandykite filtrų parametrus reprezentatyviuose mėginiuose prieš paleidimą.
- Naudokite pasitikėjimo rodiklius, kad sukurtumėte slopinimo ar žmogaus patvirtinimo srautus.
- Mobiliojo ryšio nuotraukoms užtikrinkite tinkamą apšvietimą ir kontrastinius fonus.
- Stebėkite atminties naudojimą su rungtynėmis; kai reikia, taikykite atšaukimo žymenis.
- Kombinuokite JSON eksportą su patvirtinimo paslaugomis, kad sukurtumėte tvirtus duomenų vamzdžius.
Dažnai užduodami klausimai
**Ar būtina nustatyti kalbą?**Pavyzdžiui, įrankis automatiškai nustato daug kalbų. tačiau, aiškiai nustatyti kalbą pagerina tikslumą scenarijų, pvz Cyrilų, kinų ar hindi.
**Kokius formatus palaiko?**JPEG, PNG, TIFF, PDF ir kitų populiarių formatų iš skaitytuvų ar kamerų. Rezultatai gali būti eksportuojami kaip plokščia tekstas, HTML, Word, pdf, JSON arba XML.
**Kaip aš galiu pasiekti geriausius rezultatus?**Naudokite aukštos kokybės vaizdus iš skanerių ar šiuolaikinių kamerų. įterpti filtrai pagerina vaizdo kokybę prieš atpažįstant.