Aspose.Words 文档转换器 for .NET

Aspose.Words Document Converter for .NET 是一种轻量级、高性能的 API,专注于 format-to-format 转换. 它支持常见的场景,如 Word → PDF、 HTML→PDF、“DOCX ↔ ODT”、“docx → Markdown”, PDF → 图像(JPG/PNG/TIFF),以及数十个更多 - 无需 Microsoft Office.

安装和设置

  • 安装 NuGet 包 Aspose.Words (核心 API 引力转换).
  • 在初创公司申请测量许可,以避免评估限制:见 计量许可 .
  • 审查框架要求 安装指南 .

支持的平台

  • 操作系统:Windows、Linux、MacOS
  • 框架: .NET Framework 4.x, .Net Standard 2.0 , .net Core 2.0 至 3.1 , Mono 5 / 6 / 7
  • IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

快速启动

1) Word → PDF(单线)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF 与选项

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3、DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → 图像(每页)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5、流 → 流(网页/服务)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

特性和功能性

宽格式覆盖

输入/输出(选择):

  • Word 家庭: DOC、DOCX、DOT、RTF、WORDML(XML)
  • 固定配置: PDF, 奥特 格式/Epub/)

完整的矩阵与 Aspose.Words 功能相匹配. 如果有 ** 文件处理器 ** 插件和此 ** Converter** ,您可以先下载/编辑,然后以所需格式出口.

自动格式检测

API 检测到 文件标题 或 流内容 的格式,因此您可以安全地接受 Web 服务中的自愿上传.

Fine-Tuning 與 Save 選項

  • PDF: PDF/A‐1b/2u,加密,许可旗帜,数字签名,字体嵌入,图像压缩.
  • HTML/MHTML: 资源处理(内向外),CSS模式,编码,图像格式和DPI.
  • 图像: DPI,颜色深度,压缩,页面范围,多页 TIFF.
  • Markdown: 列表和标题风格,桌面调整,链接生成.

Layout Fidelity 和 Metadata

保留字体、风格、表、标题/脚印、水标、评论、部分中断和 文档属性 (作者、名称、自定义字段.

服务器友好处理

  • Stream-first APIs,低分配,泡沫 I/O.
  • Async/batch 转换和平行输入.
  • 可设置的内存和页面处理边界为大多克.

诊断与耐力

关于腐败/不受支持的输入的明确例外;在登录/望远镜中寻找捕获时间、页面计算和失败原因 SLA 跟踪.

流行转型食谱

  • **DOCX → PDF/XPS ** 用于分发和存档(可选 PDF/A).
  • HTML → PDF 用于一致页面的发票、声明和报告.
  • DOCX ↔ ODT 为跨套件互动性.
  • DOCX → Markdown 发布技术文件.
  • PDF → PNG/JPEG/TIFF 以创建预览或简介.
  • Word/HTML → EPUB 用于电子书工作流.

提示: 使用 **PageSet ** 以出口特定页面或范围; 与 ImageSaveOptions 为插件或字符串.

最佳实践

  • 许可第一 :在任何转换之前启动测量授权,以避免评估水标.
  • 更喜欢在服务中流动,以排除磁盘 I/O 并减少延迟.
  • 早期验证 :检查魔法比特或尝试干负载快速失败.
  • **右尺寸输出 ** :选择敏感的DPI,避免插入任何字体,除非需要;选择 PDF/A ,只有在需要遵守时.
  • 資源衛生 :包裝 Document 和流入 using 区块.
  • 货币 :使用短寿 Document 例子按请求;在需要时使用游泳池为选项.
  • 可观察性 :日志页数、期限和选项设置;标记与相关ID的故障.

FAQ

**需要Microsoft Office吗?**这是一个独立的火灾.

**我可以在没有触摸文件系统的情况下转换吗?是的,所有转换都可以是 ** 流 → 潮.

**我如何执行PDF/A?**设置 PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (或2U)在储蓄之前.

**我可以使用密码保护PDF吗?**是的. 设置加密和许可旗在 PdfSaveOptions.

**Markdown round-trip 安全吗?**复杂的布局可以接近. 表,列表、标题、链接和内线格式都支持可转换的选项.

**如何转换特定页面?**使用 PageSetImageSaveOptionsFixedPageSaveOptions‑衍生阶级.

 中文