Aspose.OCR Fattura in Testo per .NET

Aspose.OCR Invoice to Text for .NET est un plug-in spécialisé conçu pour simplifier l’extraction du texte structuré des factures scannées ou photographiées. En automatisant les étapes clés - pré-traitement d’image, analyse de layout, et OCR - vous pouvez nourrir les données résultantes directement dans les systèmes comptables, les bases de données, ou les plateformes de paiement sans re-type manuelle. Le plugin délivre le même noyau de la qualité de l’OCM qu’ASPOSE.OCR, optimisé pour les réglages de facture, tables et paires de valeur clé. Vous réduirez le temps de traitement, minimisez les erreurs humaines et obtenez des résultats cohérents et précis sur scale.

Installation et configuration

Suivez ces étapes pour ajouter Aspose.OCR Invoice à Texte pour .NET à votre projet:

  • Installez via NuGet ou téléchargez le package des serveurs Aspose. Pour des instructions détaillées, voir インストール .
  • Configurez la licence mesurée au start-up de l’application pour éviter les limites d’évaluation. voir Licenza a consumo .

Exemple : Reconnaissance des factures

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Caractéristiques et fonctionnalités

Moteur de facture spécifique OCR

  • Modèles de reconnaissance adaptés pour les factures imprimées et photographiées.
  • Une tolérance élevée à des résolutions variées, des niveaux de bruit et des angles éclipsés.
  • Reconnaissance de plusieurs langues et de styles numériques dans le même document.

Pré-processage et amélioration de l’image

  • Des filtres de déchargement automatique, des filtrage et de binarisation pour améliorer la légibilité.
  • Le seuil adaptif qui maintient les lignes de facture et les frontières de table.
  • Ajustements de luminosité et de contraste pour gérer les scans sous- ou sur-exposés.

Analyse et détection de table

  • Identification automatique du titre, du footer, de la table des éléments de ligne et des blocs de résumé.
  • La reconnaissance des lignes, des colonnes et des limites cellulaires, même lorsqu’elles sont faibles ou manquantes.
  • Extraction de tables nés (par exemple, sous-articles sous un élément de ligne mère).

L’extraction de couple de valeur

  • Modèles configurables pour les noms de champ de cartes (par exemple, « Nombre de facture », « Total Due ») aux résultats de l’OCR.
  • Support pour les étiquettes dynamiques – détecte la proximité du texte au lieu de correspondre strictement au modèle.
  • Score de confiance par champ, vous permettant de filtrer ou de reproduire des articles de faible confiance.

Exportation et intégration

  • Formats de sortie : texte plain, JSON, XML, PDF, Word ou HTML.
  • Les récits d’événements interceptent les résultats crues de l’OCR avant la sérialisation.
  • Soutien au traitement de batch avec des contrôles de parallélisme pour les charges de travail de volume élevé.

Traitement et logement d’erreurs

  • Messages d’exception détaillés pour les modes de défaillance courants (par exemple, le format image non supporté, les problèmes de licence).
  • L’interface de logage intégrée compatible avec les cadres populaires de .NET (Serilog, NLog et log4net).
  • Politiques de retrait pour les erreurs transitoires lors de l’attribution du fichier I/O ou de la mémoire.

Conseils et meilleures pratiques

  • Résolution d’image prévalidée : pour une meilleure précision OCR, fournir des images à ou au-dessus de 300 DPI.
  • Utilisez des images en graisse ou en couleur - les entrées binaires uniquement peuvent perdre de belles lignes de table.
  • Tonnez les seuils de confiance en fonction de la qualité de vos données; les seusils inférieurs capturent plus de données mais peuvent nécessiter une validation en dessous.
  • Pour les lots très grands, surveillez l’utilisation de la mémoire et ajustez le parallèle via les options de traitement du plug-in.
  • Livrez la fonctionnalité de modèle de valeur clé pour congeler les layouts de facture attendus; pour les réglages inconnus, revenir sur la détection de table générique.
  • Toujours initialiser la Licence Métriée avant d’invoquer des méthodes OCR pour éviter les marques de l’évaluation-mode.

En suivant ces lignes directrices et en exploitant ses capacités de facture-centrée, Aspose.OCR Invoice to Text for .NET vous permet de construire des pipelines de traitement de documents fiables et finis à fin – minimiser l’effort manuel et maximiser la traversée.

 Français