Aspose.OCRは.NET向けの写真からテキストへの変換ツールです

Aspose.OCR Photo to Text for .NET では、開発者がカメラやスマートフォンによって撮影された写真からテキストを抽出することを可能にします。このプラグインは、アスポーズの実証されたエンジンに基づいて、高度な事前処理フィルター(回転修正、歪み補償、騒音抑制など)を適用し、スケート、低コントラスト、または騒がしい画像でも高精度の認識を提供しています.

インストール&セットアップ

始めるのは簡単です:

Aspose.OCR パッケージを NuGet を通じて、またはダウンロードされたディストリビューションからインストールします.See インストール詳細な指示を.
スタートアップで測定されたライセンスを設定して、完全な機能を解除します.参照メータードライセンスセットアップステップ.

例:写真からテキストを抽出する

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;

// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

特徴と機能

先進プロセッサフィルター

回転とスケーウ修正 :自動的にタイトルされた写真を直す.
Distortion Compensation : レンズによって引き起こされるアーティファクトと視野のウォーピングを修正します.
騒音削減 :鏡、粉、圧縮物質を抑制します.
対照と明るさ調整 :暗いまたは過剰に暴露された画像の照明を最適化します.

強力なテキスト認識エンジン

多言語のOCR(ラテン語、サイリル文字、アラビア語およびCJK文字).
印刷テキスト、サイン、スキャンをサポートするフォント診断.
混合言語ページの自動スクリプトセグメント.
数字、シンボル、点数を設定可能な範囲で認識する.

レイアウト分析とセグメント

テキストブロック対グラフィックまたはテーブルの自動検出.
コラムとラインセグメントは、自然な読書順序を維持します.
特定の地域をターゲットにするためのゾーンベースのOCR.

出力形式とデータ抽出

単純なテキスト、構造化されたオブジェクト、または JSON ボリュームボックスのコーディネート.
認証のためのライン対ラインの信頼スコアを回収します.
Generate PDF または、ダウンストリーム使用のための直接テキスト出力.

バッチとパラレル処理

NET async/await を使用するパラレル認識.
幅広いワークロードのためのクイー管理.
長期任務のキャンセルサポート.

カスタマイズと拡張性

カスタマイズされたフィルターパイプを設定します.
正確性を向上させるために、辞書やスピーカーを追加します.
ログインまたは中間検査のための認識イベントにハックします.

パフォーマンス Tuning

解像度と色の深さを調整して、スピードと正確さのバランスをとる.
繰り返しテンプレートで作業する際に事前に処理されたバッファーをキャッシュします.
プロフィールパイプラインステージは、ボトルを隔離します.

ヒントと最良の実践

処理時間を最小限にするために、事前選択または収穫の関心の地域.
実装前に代表的なサンプルでフィルターパラメーターをテストします.
信頼スコアを使用して落下または人間認証の流れを構築します.
モバイル写真では、適切な照明と対照的な背景を確保します.
バッチでメモリの使用を監視し、必要に応じてキャンセルトークンを適用します.
強力なデータパイプを構築するために、JSONの輸出と認証サービスを組み合わせる.

よくある質問

**言語を定義する必要があるか?**デフォルトでは、プラグインは多くの言語を自動的に検出します. ただし、明確に設定する言葉は、サイリリック、中国、またはヒンディーのようなスクリプトの正確性を向上させます.

**どのようなフォーマットがサポートされていますか?**JPEG、PNG、TIFF、PDF、およびスキャナーやカメラからの他の人気のフォーマット結果は、フラットテキスト、HTML、Word、pdf、JSON、またはXMLとして輸出することができます.

**どうやったら最高の結果を得ることができるの?**スキャナーや近代的なカメラからの高品質の画像を使用します内蔵フィルターは、認識前に画像の質を向上させます.