以下のテキストを翻訳します: Aspose.OCR 請求書を .NET 用のテキストに変換
Aspose.OCR Invoice to Text for .NET は、スキャンまたは撮影された請求書から構造化されたテキストの抽出を簡素化するために設計された特別なプラグインです。 キーステップを自動化することによって - イメージプレプロセッサ、レイアウト分析、および OCR - アカウントシステム、データベース、または支払いプラットフォームに直接収納することができます 手動再形式化なしに. プログインでは、アポーズと同様の高品質のOCRコアを提供します.
インストール&セットアップ
プロジェクトに Aspose.OCR Invoice を .NET のテキストに追加するために、以下の手順を実行します:
- NuGet を介してインストールまたは Aspose サーバーからパッケージをダウンロードします インストール .
- アプリケーションスタートアップで測定されたライセンスを設定して、評価制限を避ける メータードライセンス .
例:請求書の認定
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);特徴と機能
OCR エンジン
- 印刷および写真の請求書の適切な認識モデル.
- さまざまな解像度、騒音レベル、および滑り角に対する寛容性が高い.
- 複数の言語とデジタルスタイルを同じ文書内で認識する.
イメージプロセッサ&改善
- 読みやすさを向上させるために、自動スイッチ、デフレ、およびバイナリ化フィルター.
- 会計線とテーブルの境界線を維持する適応性の限界.
- 明るさと対照調整は、下または過度に曝露されたスキャンに対処します.
レイアウト分析&テーブル検出
- ヘッダー、フォーター、ラインアイテムテーブル、および概要ブロックの自動識別.
- 行、列、細胞の境界線の認識は、支配線が弱く、あるいは欠けている場合でも.
- ナストテーブルの抽出(例えば、マザーラインの項目の下のサブアイテム).
カップルエクストラクション
- 地図のフィールド名(例えば「請求書番号」、「Total Due」)に設定可能なテンプレートを OCR 結果に表示します.
- ダイナミックラベルのサポート - 厳格なテンプレートに匹敵する代わりにテキストの接近を検出します.
- フィールドごとに信頼のスコアを設定し、低自信のアイテムをフィルタリングまたは再生することができます.
輸出&統合
- 出力形式:フライトテキスト、JSON、XML、PDF、Word、またはHTML.
- イベントハウスは、シリアリズムの前に原料OCRの結果を中断します.
- パラレリズムコントロールを搭載したバッチ処理サポート 高容量作業負荷.
エラー処理&ログイン
- 一般的な失敗モードの詳細な例外メッセージ(例えば、サポートされていない画像形式、ライセンス問題など).
- 人気のある .NET ログ フレームワーク(Serilog、NLog 、log4net)と互換性のある内蔵ログイン インターフェイス).
- ファイル I/O またはメモリ割り当ての間の過渡エラーの取り戻しポリシー.
ヒントと最良の実践
- 事前に認証された画像解像度:最良のOCR正確性のために、画像を300 DPIまたはそれ以上で提供します.
- グレイスケールまたは色の画像を使用する - バイナリー単なる入力は、薄いテーブルラインを失う可能性があります.
- データの品質に基づいて信頼の限界を設定し、より低い制限はより多くのデータを捕獲するが、ダウンストリーム認証を必要とする可能性がある.
- 非常に大きなバッチでは、メモリの使用を監視し、プラグインの処理オプションを通じてパラレルを調整します.
- キー値テンプレート機能をアップロードして予想される請求書の配置を凍結し、未知の設定では、一般的なテーブル検出に戻ります.
- 評価モードウォーターマークを避けるために、OCR方法を呼び出す前に常にMetered Licensingを開始します.
これらのガイドラインに従い、その会計中心能力を利用することによって、 Aspose.OCR Invoice to Text for .NET は、手動の努力を最小限にし、通路を最大化するために、信頼性の高い文書処理パイプラインを構築することができます.