Aspose.OCR Foto uz teksta .NET
Aspose.OCR Photo to Text for .NET ļauj izstrādātājiem izrakstīt tekstu no fotoattēliem, kas uzņemti kameras vai viedtālruņi.Iebūvēts uz pierādīta asposa.ocR motora, šis plugins piemēro progresīvus pirmsapstrādes filtrus – piemēram, rotācijas korekciju, izkropļojuma kompensāciju un trokšņa apturēšanu –, lai nodrošinātu augstas precizitātes atpazīšanu pat uz skudinātiem, zemu kontrastu vai troksni attēli.
Instalācija un uzstādīšana
Sākt ir vienkārši:
- Instalējiet Aspose.OCR paketi, izmantojot NuGet vai no lejupielādētā izplatītāja.See Installation Par detalizētām instrukcijām.
- Konfigurējiet mērīto licencēšanu start-up, lai atslēgtu pilnīgu funkcionalitāti.Atsauces uz Mērtēta licencēšana uzstādīšanas posmiem.
Piemērs: Izņemt tekstu no fotogrāfijām
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Iezīmes un funkcionalitātes
Advanced Pre-processing filtri
- Rotacija un Skew Korekcija : automātiski taisnst attēlus.
- Distortion Compensation : Korektē lēcu inducētus artefaktus un perspektīvu.
- Braužu samazināšana : novērš spoguļus, putekļus un kompresijas izstrādājumus.
- Kontrasts un spilgtuma pielāgošana : optimizē apgaismojumu dīvainiem vai pārmērīgi eksponētiem attēliem.
Spēcīgs teksta atpazīšanas motors
- Daudzvalodu OCR (latīņu, ciriliešu, arābu un CJK skripti).
- Font-agnostic detekcija, kas atbalsta drukāto tekstu, signālus un skenēšanu.
- Automātiska skript segmentācija sajauktās valodas lapās.
- Numuru, simbolu un punktu atzīšana ar konfigurējamiem robežām.
Layout analīze un segmentācija
- Automātiska teksta bloku atklāšana pret grafiku vai tabulu.
- Kolonnas un līnijas segmenta saglabā dabisko lasīšanas kārtību.
- Zonas bāzes OCR, lai mērķētu konkrētus reģionus.
Izplūdes formāti un datu ekstrakcija
- eksportu plašu tekstu, strukturētus objektus, vai JSON ar limuzīnu koordinātiem.
- Retrieve line-by-line uzticības rādītāji validācijai.
- Generate PDF vai teksta iznākumi tieši lejupslīdes lietošanai.
Batch un paralēla apstrāde
- Paralēli atpazīšana, izmantojot .NET async/await.
- Pārbaude plaša darba slodzes vadībai.
- Atcelšanas atbalsts ilgstošiem uzdevumiem.
Personalizācija un paplašināšanās
- Iestatīt pielāgotus filtra caurules.
- Pievienojiet vārdus vai vārdnīcas, lai uzlabotu precizitāti.
- Iepazīstiet atpazīšanas notikumus reģistrācijas vai starpnozaru pārbaudes vajadzībām.
Izdevējs Tuning
- Iestatīt izšķirtspēju un krāsu dziļumu, lai nodrošinātu ātruma un precizitātes līdzsvaru.
- Uzglabāt iepriekš apstrādātus buferus, strādājot ar atkārtotiem šabloniem.
- Profilēšanas cauruļvadu posmi, lai izolētu pudeles.
Padomi un labākās prakses
- Pre-izvēlēti vai augu ieinteresētie reģioni, lai samazinātu apstrādes laiku.
- Pārbaudiet filtra parametrus uz reprezentatīviem paraugiem pirms ievietošanas.
- Izmantojiet uzticības rādītājus, lai izveidotu fallback vai cilvēka validācijas plūsmas.
- Mobilās fotogrāfijās nodrošiniet pareizu apgaismojumu un kontrastējošu fonu.
- Pārrauga atmiņas izmantošanu ar batch runām; vajadzības gadījumā piemēro atcelšanas tokenus.
- Kombinēt JSON eksportu ar validācijas pakalpojumiem, lai izveidotu spēcīgus datu cauruļvadas.
Bieži uzdotie jautājumi
**Vai ir nepieciešams norādīt valodu?**Pamatoti, plugins automātiski atklāj daudzās valodās. tomēr, skaidri noteikts valoda uzlabo precizitāti rakstzīmju, piemēram, Cyrillic, ķīniešu vai hindi.
**Kādi formāti tiek atbalstīti?**JPEG, PNG, TIFF, PDF un citi populāri formāti no skaneriem vai kameras. Rezultāti var tikt eksportēti kā plašs teksts, HTML, Word, pdf, JSON vai XML.
**Kā es varu sasniegt labākos rezultātus?**Izmanto augstas kvalitātes attēlus no skaneriem vai mūsdienu kameras. iebūvēti filtri uzlabo attēla kvalitāti pirms atpazīšanas.