Aspose.PDF XLS转换器适用于.NET

主持人.PDF XLS NET 转换器是一个轻重的插件,旨在改造 PDF 文档页面转换为高品质的Microsoft Excel分布表(XLS / XLSX)。它允许开发人员提取表数据,保存布局,并以精细的控制输出参数自动交换.

开始使用

安装和设置

  • 通过 NuGet 安装包:
dotnet add package Aspose.PDF

特点与功能

PDF 到 Excel 转换

  • 将每个 PDF 页面转换为一个单独的工作表或将多页合成一个.
  • 出口到 .xls.xlsx 格式.

页面和范围选择

  • 转换完整的文件或特定的序列/页面.
  • 支持对选择性提取的非相关范围.

Layout 和 Formatting 保存

  • 它保留字体、颜色、细胞边界、合并细节和头条/脚条.
  • 确保 Excel 输出镜像 PDF 视觉忠诚度.

桌子认可

  • 检测和重建表数据到 Excel 行/列.
  • 保留数字格式(货币、百分比、日期)进行准确的计算.

密码保护的PDF

  • 支持加密PDF的转换,通过实时提供认证.

字体和资源

  • 嵌入式字体将转移到 Excel.
  • 替代品保持布局,如果字体不可用.

性能优化

  • 基于流的转换处理页面不断.
  • Caching 和 Buffer 尺寸控制改善大文件的输入.

错误处理和登录

  • 对未支持的内容或错误输入的详细例外.
  • 登录插槽以捕获进展、警告和错误.

带安全和Async支持

  • 支持在多层环境中进行相互转换.
  • 可扩展工作负载的无同步方法.

代码示例:将 PDF 转换为 XLS (Excel)

var inputPath = Path.Combine(@"C:\\Samples\\", "sample.pdf");
var outputPath = Path.Combine(@"C:\\Samples\\", "sample.xlsx");

// Initialize the plugin
var plugin = new PdfXls();
var options = new PdfToXlsOptions
{
    Format = PdfToXlsOptions.ExcelFormat.XLSX
};

options.AddInput(new FileDataSource(inputPath));
options.AddOutput(new FileDataSource(outputPath));

var resultContainer = plugin.Process(options);
var result = resultContainer.ResultCollection[0];
Console.WriteLine(result);

提示和最佳实践

  • 预扫描PDF以检测表格与文本内容,以优化转换.
  • 使用页面范围以尽量减少不必要的处理.
  • 有转换器例子释放未经管理的资源.
  • 在大规模操作中,使用与控制的平行主义相同的API.
  • 在部署之前在测试中验证数字格式.
  • 监控未支持的功能或错误输入的日志.
  • 插入非标准字体,以防止配置错误.
  • 保持插件更新,以确保准确性和性能改进.

高级功能

  • 同时转换多个PDF.
  • 加密结果的 Excel 文件,以确保安全的分配.
  • 可自定义的输出配置,适应报告或遵守要求.

用例

  • 通过将表提取到Excel分析.
  • 从静态PDF档案转移到可编辑的Excel表.
  • 自动工作流符合和审计.
  • 集体表数据从账单、声明或表格中提取.

经常提出的问题

**该插件提供哪些功能?**它将 PDF 文档页面转换为 XLS/XLSX 分布表,保存布局和表数据.

**这与 .NET 的 Aspose.PDF 有什么区别?**Aspose.PDF for .NET 是一个完整的 PDF 图书馆,而该插件仅专注于 PDF 为 Excel 转换.

**是否仅限于 XLS/XLSX 转换?**是的,对于其他 PDF 任务(编辑、合并、压缩),请使用主 Aspose.PDF 图书馆.

**有没有在线工具可用?**是的,Aspose 提供免费的在线 PDF 到 XLS/XLSX 转换器.

**在哪里可以找到代码的例子?**查看 Aspose.PDF 文档和登陆页面,以获取 C# 和 VB.NET 的详细示例.

 中文