Converti la foto di Aspose.OCR in testo per .NET
Aspose.OCR Photo to Text pour .NET permet aux développeurs d’extraire le texte des photographies capturées par les caméras ou les smartphones. Construit sur le moteur Aspouse.ocR, ce plug-in applique des filtres de pré-traitement avancés - tels que la correction de rotation, la compensation de la déformation et la suppression du bruit - pour fournir une reconnaissance de haute précision même sur des images écrasées, à faible contraste ou bruyantes.
Installation et configuration
Commencer est simple:
- Installez le paquet Aspose.OCR via NuGet ou d’un distributeur téléchargé.See インストール Pour des instructions détaillées.
- Configurez la licence mesurée au start-up pour déverrouiller la fonctionnalité complète.Se référer à Licenza a consumo pour les étapes de configuration.
Exemple : extraire du texte des photos
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Caractéristiques et fonctionnalités
Filtres de pré-traitement avancés
- Rotation et correction de l’écran : Régénère automatiquement les photos tapées.
- Compensation de distorsion : Correcte les objets induits par lente et la perte de perspective.
- Réduction du bruit : supprime les miroirs, la poussière et les objets de compression.
- Contrast and Brightness Adjustment : Optimise l’éclairage pour les images dime ou surexposées.
Moteur de reconnaissance de texte robuste
- Multi-langue OCR (Latin, Cyrillic, Arabic et CJK scripts).
- La détection diagnostique font supportant le texte imprimé, la signature et les scans.
- Ségrégation automatique des scripts sur des pages de langue mixte.
- Reconnaissance de nombres, de symboles et de points avec des limites configurables.
Layout Analyse et segmentation
- Détection automatique de blocs de texte versus graphiques ou tables.
- La segmentation des colonnes et des lignes maintient l’ordre de lecture naturel.
- OCR à base de zone pour cibler des régions spécifiques.
Formats de sortie et extraction de données
- Exportation de texte plain, objets structurés, ou JSON Les coordonnées de boîte de bord.
- Retrouvez les résultats de confiance en ligne pour la validation.
- Generate PDF ou des sorties de texte directement pour un usage downstream.
Batch et traitement parallèle
- Reconnaissance parallèle en utilisant .NET async/await.
- La gestion de la quête pour les charges de travail à grande échelle.
- Support pour les tâches à long terme.
Customisation et extensibilité
- Définir les pipelines de filtre personnalisées.
- Ajoutez des dictionnaires ou des vocabulaires pour améliorer l’exactitude.
- Mettre en place des événements de reconnaissance pour l’enregistrement ou une inspection intermédiaire.
Tuning des performances
- Ajuster la résolution et la profondeur de la couleur pour un équilibre entre vitesse et précision.
- Cache les buffers pré-traités lorsque vous travaillez avec des modèles répétés.
- Étapes de pipeline de profil pour isoler les bouteilles.
Conseils et meilleures pratiques
- Les régions pré-sélectionnées ou les zones d’intérêt pour réduire au minimum le temps de traitement.
- Test des paramètres de filtre sur des échantillons représentatifs avant le déploiement.
- Utilisez des scores de confiance pour construire des flux de réchauffement ou de validation humaine.
- Pour les photos mobiles, assurez un éclairage approprié et contraste des fonds.
- Suivez l’utilisation de la mémoire avec les courses de batch; appliquez les tokens d’annulation si nécessaire.
- Combiner l’exportation JSON avec les services de validation pour construire des pipelines de données robustes.
Questions fréquentes posées
**Est-il nécessaire de spécifier une langue?**Par défaut, le plugin détecte automatiquement de nombreuses langues. Cependant, la configuration explicite de la langue améliore l’exactitude pour les scripts tels que Cyrillic, Chinois, ou Hindi.
**Quels formats sont soutenus?**JPEG, PNG, TIFF, PDF, et autres formats populaires des scanners ou des caméras. Les résultats peuvent être exportés en tant que texte plain, HTML, Word, pdf, JSON, ou XML.
**Comment puis-je obtenir les meilleurs résultats?**Utilisez des images de haute qualité des scanners ou des caméras modernes. Les filtres intégrés améliorent la qualité de l’image avant la reconnaissance.