Aspose.PDF表单导出器 for .NET

Aspose.PDF Form Exporter for .NET 是一个精致的插件,建立在核心的 Asposa.pdf 引擎上,旨在自动化从 AcroForms 在现有 PDF 文档中提取数据。 通过简化表格数据出口工作流,它允许 .Net 开发人员将提交到更大的管道,尽量减少手动数据输入,并在行业标准格式中提供表单内容。

该插件与 .NET 应用程序无缝集成,为开发人员提供了将提取的数据运送到数据库、分布表或替代文档格式的能力。

开始使用

安装和设置

  • 在您的 .NET 项目中引用 Aspose.PDF 图书馆。
  • 通过 NuGet 安装包或直接从 Aspose 网站下载集合。
  • 在应用程序初创时设置测量许可,以避免评估限制。 计量许可 对于细节。

特点与功能

1、多格式数据输出

出口形式的数据,没有写字的逻辑:

  • • FDF(Adobe Form Data Format)
  • XFDF - 基于XML的替代品。
  • XML - 用于网页服务和自定义管道。
  • JSON - Lightweight,人可读的格式。
  • CSV - 理想的数据分析和报告。

二、领域级别选择与过滤

检查哪些领域出口:

  • 包含/排除列表。
  • Wildcard 模式(“*”,“?”)用于大批匹配。
  • 减少负载大小,简化下流处理。

3、Batch 加工与性能

  • 基于流的API为高容量场景。
  • 平行提取的安全操作。
  • 优化 I/O 和 Buffering 为最小的资源使用。

四、地理和复杂领域支持

  • 它完全支持粘着的字段、无线电团体和多部分检查箱。
  • 操作列表/combo 盒子,单或多选。
  • 从签名或条码字段中提取原始数据和金属数据。

5、流和基于文件的API

  • File-path overloads 用于桌面/控制台应用程序。
  • Stream overloads for serverless/web apps。
  • 内存地图支持 高速使用案例。

6、错误处理与验证

  • 详细的例外,对变形的形式。
  • 对所需领域进行验证。
  • Callback Hooks 为自定义登录和修复。

7、扩展与整合

  • 与文档转换为终端PDF管道相结合。
  • 与搜索或编辑模块集成。
  • 插入 DI 容器或中间软件,以便连续设置。

代码示例:将 PDF 表格导入 CSV

// Define input and output paths
var inputPath = Path.Combine(@"C:\Samples\", "form.pdf");
var outputPath = Path.Combine(@"C:\Samples\", "form-data.csv");

// Create an instance of the FormExporter class
var exporter = new FormExporter();

// Configure options for CSV export
var options = new FormExporterValuesToCsvOptions
{
    Delimiter = ","
};

// Add input and output sources
options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

// Process extraction
var resultContainer = exporter.Process(options);

// Access results
var result = resultContainer.ResultCollection[0];
Console.WriteLine(result);

提示和最佳实践

  • 最少使用記憶體 – 使用基於流的超充電和集合操作。
  • 预验证字段列表 – 隐藏字体名称,以避免类型或表格版本的错误变化。
  • 使用 Wildcards 仔细 – 限制对已知的预定 / 附件的模式,以防止无意中出口。
  • Monitor Performance - 跟踪通道和资源使用,按此调整带池大小。
  • License Early - 在初创公司设置许可证,以防止长期工作时间问题。
  • Graceful Error Recovery - Wrap in try/catch with logging and retry mechanisms 通过登录和退出机制进行呼叫。
  • Integrate Logging - 捕捉测量,如字段计算和输出大小,用于容量规划。

经常提出的问题

**.NET 表格出口器提供什么?**它可有效地将 AcroForm 数据提取到多个格式(FDF、XFdf、 XML、JSON、CSV),具有强大的过滤和性能功能。

**这与 .NET 的 Aspose.PDF 有什么区别?**Aspose.PDF for .NET 是一个完整的 PDF API. Form Exporter 插件专门为 AcroForm 数据出口进行简化。

**是否适合大规模自动化?**是的,插件优化为集合处理、多流和基于流的工作流。

**我只能出口所选择的领域吗?**是的,您可以使用包含/排除列表或 Wildcard 模式来过滤出口的数据。

**出口的数据是否可以集成到外部系统中?**是的,灵活的输出格式(XML、JSON、CSV等)允许与数据库、分布表或网页服务无缝集成。

 中文