Aspose.OCR Photo till Text för .NET
Aspose.OCR Photo to Text för .NET gör det möjligt för utvecklare att extrahera text från foton som tagits av kameror eller smartphones. Byggd på den beprövade Aspos.OKR-motorn, tillämpar denna plugin avancerade pre-processing-filter - såsom rotation korrigering, förvrängning kompensation och buller suppression - för att leverera hög noggrannhet erkännande även på skräddarsydda, låga kontraster eller bullriga bilder.
Installation och installation
Att börja är enkelt:
- Installera Aspose.OCR-paketet via NuGet eller från en nedladdad distributör.See Installation för detaljerade instruktioner.
- Konfigurera måttlig licens vid start för att låsa upp full funktionalitet.hänvisar till Mätlicensiering för inställningssteg.
Exempel: Att extrahera text från bilder
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Funktioner och funktioner
Avancerade förbearbetningsfilter
- Rotation och Skew Correction : Riktar automatiskt bilderna.
- Distortion Compensation : Korrigerar linsinducerade artefakter och perspektiv warping.
- Ljudminskning : Stryker speglar, damm och komprimeringsartiklar.
- Kontrast och ljusstyrka justering : optimerar belysning för dim eller överexponerade bilder.
Robust Text Recognition Engine
- Flerspråkiga OCR (latinska, cyrilliska, arabiska och CJK-skript).
- Font-agnostikdetektion som stöder tryckt text, signage och skanningar.
- Automatisk skriptsegmentering på blandade språksidor.
- Identifiering av siffror, symboler och poäng med konfigurerbara gränser.
Layout Analys och Segmentering
- Automatisk upptäckt av textblock mot grafik eller tabeller.
- Kolumnen och linjen segmentering bevarar naturlig läsordning.
- Zone-baserad OCR för att rikta specifika regioner.
Utgångsformat och datautvinning
- Exportera platt text, strukturerade objekt, eller JSON med bounding-box koordinater.
- Återställa line-by-line förtroende poäng för validering.
- Generate PDF eller textutgångar direkt för nedströmsanvändning.
Batch och parallell bearbetning
- Parallell erkännande med hjälp av .NET async/await.
- Cheue management för storskaliga arbetsbelastningar.
- Annulleringstöd för långvariga uppgifter.
Anpassning och Extensibilitet
- Definiera skräddarsydda filterrör.
- Lägg till ordböcker eller ordförråd för att förbättra noggrannheten.
- Hoppa in i erkännande händelser för loggning eller mellanliggande inspektion.
prestanda toning
- Justera upplösning och färgdjup för balans mellan hastighet och noggrannhet.
- Hämta förbearbetade buffrar när du arbetar med upprepade mallar.
- Profilrörsteg för att isolera flaskor.
Tips och bästa praxis
- Förutvalda eller odlade områden av intresse för att minimera bearbetningstiden.
- Testa filterparametrar på representativa prover före användning.
- Använd förtroendepoäng för att bygga fallback eller humant valideringsflöden.
- För mobila foton, se till att lämplig belysning och kontrasterande bakgrunder.
- Övervaka användningen av minnet med batch-runs; tillämpa annulleringstokener där det behövs.
- Kombinera JSON export med valideringstjänster för att bygga robusta datarör.
Ofta ställda frågor
**Är det nödvändigt att specificera ett språk?**Som standard upptäcker plugin automatiskt många språk. emellertid förbättrar språkets uttryckliga inställning noggrannheten för skript som cirilliska, kinesiska eller hindi.
**Vilka format stöds?**JPEG, PNG, TIFF, PDF och andra populära format från skannrar eller kameror. Resultat kan exporteras som platt text, HTML, Word, pdf, JSON, eller XML.
**Hur kan jag uppnå de bästa resultaten?**Använd högkvalitativa bilder från skannrar eller moderna kameror. Inbyggda filter förbättrar bildkvaliteten före upptäckt.