Aspose.PDF XLS转换器适用于.NET

Aspose.PDF XLS Converter for .NET 是一款轻量级插件,旨在将 PDF 文档页面转化为高品质的 Microsoft Excel 扩展表(XLS/X LSX)。它允许开发人员提取表数据,保存布局,并自动转换集合,对输出参数进行精细控制。

开始使用

安装和设置

  • 通过 NuGet 安装包:
dotnet add package Aspose.PDF

特点与功能

PDF 到 Excel 转换

  • 将每个 PDF 页面转换为一个单独的工作表或将多页合成一个。
  • 出口到 .xls.xlsx 格式。

页面和范围选择

  • 转换完整的文件或特定的序列/页面。
  • 支持对选择性提取的非相关范围。

Layout 和 Formatting 保存

  • 它保留字体、颜色、细胞边界、合并细节和头条/脚条。
  • 确保 Excel 输出镜像 PDF 视觉忠诚度。

桌子认可

  • 检测和重建表数据到 Excel 行/列。
  • 保留数字格式(货币、百分比、日期)进行准确的计算。

密码保护的PDF

  • 支持加密PDF的转换,通过实时提供认证。

字体和资源

  • 嵌入式字体将转移到 Excel。
  • 替代品保持布局,如果字体不可用。

性能优化

  • 基于流的转换处理页面不断。
  • Caching 和 Buffer 尺寸控制改善大文件的输入。

错误处理和登录

  • 对未支持的内容或错误输入的详细例外。
  • 登录插槽以捕获进展、警告和错误。

带安全和Async支持

  • 支持在多层环境中进行相互转换。
  • 可扩展工作负载的无同步方法。

代码示例:将 PDF 转换为 XLS (Excel)

var inputPath = Path.Combine(@"C:\\Samples\\", "sample.pdf");
var outputPath = Path.Combine(@"C:\\Samples\\", "sample.xlsx");

// Initialize the plugin
var plugin = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

var resultContainer = plugin.Process(options);
var result = resultContainer.ResultCollection[0];
Console.WriteLine(result);

提示和最佳实践

  • 预扫描PDF以检测表格与文本内容,以优化转换。
  • 使用页面范围以尽量减少不必要的处理。
  • 有转换器例子释放未经管理的资源。
  • 在大规模操作中,使用与控制的平行主义相同的API。
  • 在部署之前在测试中验证数字格式。
  • 监控未支持的功能或错误输入的日志。
  • 插入非标准字体,以防止配置错误。
  • 保持插件更新,以确保准确性和性能改进。

高级功能

  • 同时转换多个PDF。
  • 加密结果的 Excel 文件,以确保安全的分配。
  • 可自定义的输出配置,适应报告或遵守要求。

用例

  • 通过将表提取到Excel分析。
  • 从静态PDF档案转移到可编辑的Excel表。
  • 自动工作流符合和审计。
  • 集体表数据从账单、声明或表格中提取。

经常提出的问题

**该插件提供哪些功能?**它将 PDF 文档页面转换为 XLS/XLSX 分布表,保存布局和表数据。

**这与 .NET 的 Aspose.PDF 有什么区别?**Aspose.PDF for .NET 是一个完整的 PDF 图书馆,而该插件仅专注于 PDF 为 Excel 转换。

**是否仅限于 XLS/XLSX 转换?**是的,对于其他 PDF 任务(编辑、合并、压缩),请使用主 Aspose.PDF 图书馆。

**有没有在线工具可用?**是的,Aspose 提供免费的在线 PDF 到 XLS/XLSX 转换器。

**在哪里可以找到代码的例子?**查看 Aspose.PDF 文档和登陆页面,以获取 C# 和 VB.NET 的详细示例。

 中文