Aspose.Words 文档转换器 for .NET
Aspose.Words Document Converter for .NET 是一种轻量级、高性能的 API,专注于 format-to-format 转换. 它支持常见的场景,如 Word → PDF、 HTML→PDF、“DOCX ↔ ODT”、“docx → Markdown”, PDF → 图像(JPG/PNG/TIFF),以及数十个更多 - 无需 Microsoft Office.
安装和设置
支持的平台
- 操作系统:Windows、Linux、MacOS
- 框架: .NET Framework 4.x, .Net Standard 2.0 , .net Core 2.0 至 3.1 , Mono 5 / 6 / 7
- IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
快速启动
1) Word → PDF(单线)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF 与选项
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3、DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → 图像(每页)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5、流 → 流(网页/服务)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
特性和功能性
宽格式覆盖
输入/输出(选择):
- Word 家庭: DOC、DOCX、DOT、RTF、WORDML(XML)
- 固定配置: PDF, 奥特 格式/Epub/)
完整的矩阵与 Aspose.Words 功能相匹配. 如果有 ** 文件处理器 ** 插件和此 ** Converter** ,您可以先下载/编辑,然后以所需格式出口.
自动格式检测
API 检测到 文件标题 或 流内容 的格式,因此您可以安全地接受 Web 服务中的自愿上传.
Fine-Tuning 與 Save 選項
- PDF: PDF/A‐1b/2u,加密,许可旗帜,数字签名,字体嵌入,图像压缩.
- HTML/MHTML: 资源处理(内向外),CSS模式,编码,图像格式和DPI.
- 图像: DPI,颜色深度,压缩,页面范围,多页 TIFF.
- Markdown: 列表和标题风格,桌面调整,链接生成.
Layout Fidelity 和 Metadata
保留字体、风格、表、标题/脚印、水标、评论、部分中断和 文档属性 (作者、名称、自定义字段.
服务器友好处理
- Stream-first APIs,低分配,泡沫 I/O.
- Async/batch 转换和平行输入.
- 可设置的内存和页面处理边界为大多克.
诊断与耐力
关于腐败/不受支持的输入的明确例外;在登录/望远镜中寻找捕获时间、页面计算和失败原因 SLA 跟踪.
流行转型食谱
- **DOCX → PDF/XPS ** 用于分发和存档(可选 PDF/A).
- HTML → PDF 用于一致页面的发票、声明和报告.
- DOCX ↔ ODT 为跨套件互动性.
- DOCX → Markdown 发布技术文件.
- PDF → PNG/JPEG/TIFF 以创建预览或简介.
- Word/HTML → EPUB 用于电子书工作流.
提示: 使用 **PageSet ** 以出口特定页面或范围; 与 ImageSaveOptions 为插件或字符串.
最佳实践
- 许可第一 :在任何转换之前启动测量授权,以避免评估水标.
- 更喜欢在服务中流动,以排除磁盘 I/O 并减少延迟.
- 早期验证 :检查魔法比特或尝试干负载快速失败.
- **右尺寸输出 ** :选择敏感的DPI,避免插入任何字体,除非需要;选择 PDF/A ,只有在需要遵守时.
- 資源衛生 :包裝
Document
和流入using
区块. - 货币 :使用短寿
Document
例子按请求;在需要时使用游泳池为选项. - 可观察性 :日志页数、期限和选项设置;标记与相关ID的故障.
FAQ
**需要Microsoft Office吗?**这是一个独立的火灾.
**我可以在没有触摸文件系统的情况下转换吗?是的,所有转换都可以是 ** 流 → 潮.
**我如何执行PDF/A?**设置 PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(或2U)在储蓄之前.
**我可以使用密码保护PDF吗?**是的. 设置加密和许可旗在 PdfSaveOptions
.
**Markdown round-trip 安全吗?**复杂的布局可以接近. 表,列表、标题、链接和内线格式都支持可转换的选项.
**如何转换特定页面?**使用 PageSet
在 ImageSaveOptions
或 FixedPageSaveOptions
‑衍生阶级.