Aspose.OCR将照片转换为.NET文本
Aspose.OCR Photo to Text for .NET 允许开发人员从摄像机或智能手机拍摄的照片中提取文本. 建立在已验证的 ASPOSE.OKR 引擎上,该插件应用先进的预处理过滤器 - 如旋转纠正、扭曲补偿和噪音抑制 - 为高准确的识别,即使在滑动、低对比或噪声图像上.
安装和设置
开始是简单的:
例:从照片中提取文本
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;
// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
特点与功能
先进预处理过滤器
- 旋转和Skew纠正 :自动直播粘贴照片.
- Distortion Compensation :纠正镜头引导的对象和视野冲动.
- 噪音减少 :抑制镜子、尘埃和压缩物质.
- 对比和亮度调整 :为模糊或过度曝光的图像优化照明.
强大的文本识别引擎
- 多语言 OCR(拉丁、西里语、阿拉伯语和CJK文本).
- 字体诊断检测支持印刷文本、签名和扫描.
- 在混合语言页面上的自动脚本分区.
- 识别数字、符号和点数与可配置的边界.
Layout 分析与分区
- 自动检测文本块与图形或表.
- 列和线序列保持自然阅读顺序.
- 基于区域的OCR针对特定区域.
输出格式和数据提取
包装和平行处理
- 使用 .NET async/await 的平行识别.
- 对大规模工作负载进行审查管理.
- 取消长期任务的支持.
定制和扩展性
- 定义定制过滤管.
- 添加字典或词典以提高准确性.
- 进入登录或中间检查的识别事件.
表演Tuning
- 调整分辨率和颜色深度,以确保速度和准确度之间的平衡.
- 在使用重复模板时隐藏预处理的泡沫.
- 配置管道步骤以隔离瓶子.
提示和最佳实践
- 提前选择或种植有兴趣的地区,以尽量减少处理时间.
- 在部署之前测试代表性样品的过滤器参数.
- 使用信任分数来构建落后或人类验证流.
- 对于移动照片,确保适当的照明和对比背景.
- 跟踪与包运行的内存使用;在需要时应用取消标志.
- 将 JSON 出口与验证服务相结合,以建立强大的数据管道.
经常提出的问题
**需要指定语言吗?**默认情况下,插件自动检测到许多语言,但是,明确设置语言提高了像西里语、中文或印度语这样的脚本的准确性.
**支持哪些格式?**JPEG、PNG、TIFF、PDF和其他受欢迎的格式来自扫描仪或摄像机. 结果可以作为平板文本、HTML、Word、pdf、JSON或XML出口.
**我怎么能得到最好的结果?**使用高品质的图像从扫描仪或现代摄像机. 内置的过滤器在识别之前提高图形质量.