.NET 的发票转文本

.NET 的发票转文本简介

.NET 的发票转文本是一个插件,它允许开发人员从发票中提取文本,并将其转换为可编辑的格式。本指南将引导您了解可用的功能、如何开始以及提供 C# 中的代码示例。

支持的文件格式

该插件支持从各种图像和文档文件格式中提取文本,包括:

  • JPEG
  • PNG
  • GIF
  • BMP
  • TIFF

从发票中提取文本

要从发票中提取文本,您可以使用以下代码示例:

Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// 添加图像到 OcrInput 对象
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// 设置识别语言
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// 识别图像
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}
// 保存为文件
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
// 或
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

API 参考

有关可用类、方法和属性的更多信息,请参阅 API 参考文档

 中文