Bộ chuyển đổi tài liệu Aspose.Words cho .NET
Aspose.Words Document Converter for .NET là một API nhẹ, hiệu suất cao tập trung vào format-to-format chuyển đổi. Nó hỗ trợ các kịch bản phổ biến như Word → PDF, HTML→PDF**, DOCX ↔ ODT* , * DOCX → Markdown** và PDF → hình ảnh (JPG/PNG/TIFF) mà không cần Microsoft Office. Được xây dựng cho máy chủ và đám mây tải công việc, nó cung cấp kết quả xác định, sử dụng bộ nhớ thấp, và dòng đầu tiên dòng công tác.
Cài đặt & Setup
- Cài đặt gói NuGet
Aspose.Words
(Nhật Bản API Power Conversion). - Ứng dụng giấy phép đo lường tại startup để tránh giới hạn đánh giá: xem Giấy phép theo mức sử dụng .
- Đánh giá các yêu cầu khung trong Hướng dẫn cài đặt .
Các nền tảng được hỗ trợ
- Hệ điều hành: Windows, Linux, macOS
- Các khung: .NET Framework 4.x, .Net Standard 2.0,.NET Core 2.0–3.1, .net 5/6/7+, Mono
- ID: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Khởi động nhanh
1) Word → PDF (một dòng)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF với các tùy chọn
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → hình ảnh (trên mỗi trang)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Stream → stream (web / dịch vụ)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Tính năng và chức năng
Màn hình bao phủ rộng
nhập / xuất (được chọn):
- Gia đình Word: DOC, DOCX, DOT, RTF, WordML (XML)
- Thiết kế cố định: PDF, OTT định dạng / ePub/)
Full matrix aligns with Aspose.Words capabilities.If both a **File Processor ** plugin and this Converter are present, you can load/edit first and then export in the desired format.Nếu cả hai đều có sẵn, bạn có thể tải / chỉnh sửa trước và sau đó xuất trong định dạng mong muốn.
Tự động định dạng phát hiện
API phát hiện định dạng từ các tiêu đề tệp hoặc nội dung dòng , vì vậy bạn có thể an toàn chấp nhận tải lên tự nguyện trong các dịch vụ web.
Fine-Tuning với Save Options
- PDF: PDF/A‐1b/2u, mã hóa, lá cờ giấy phép, chữ ký kỹ thuật số, phông chữ tích hợp, hình ảnh nén.
- HTML/MHTML: Quản lý tài nguyên (trong nội bộ vs. bên ngoài), chế độ CSS, mã hóa, định dạng hình ảnh & DPI.
- Hình ảnh: DPI, độ sâu màu, nén, phạm vi trang, nhiều trang TIFF.
- Markdown: danh sách và phong cách tiêu đề, điều chỉnh bảng, tạo liên kết.
Layout Fidelity và Metadata
Bảo tồn các phông chữ, phong cách, bảng, tiêu đề / chân, dấu hiệu nước, bình luận, phân đoạn, và ** tài liệu thuộc tính** (tác giả, chủ đề, trường tùy chỉnh.
Server-Friendly xử lý
- Stream-first APIs, phân bổ thấp, buffered I/O.
- Async/batch chuyển đổi và đồng bộ hóa cho thông qua.
- Cài đặt bộ nhớ & biên giới xử lý trang cho các docs lớn.
Chẩn đoán & độ bền
Ngoại trừ rõ ràng về các mục nhập bị hư hỏng/không được hỗ trợ; hook into logging/telemetry to capture durations, page count, and failure reasons for SLA theo dõi.
Công thức chuyển đổi phổ biến
- **DOCX → PDF/XPS ** cho phân phối & lưu trữ (tùy chọn PDF/A).
- HTML → PDF cho các hóa đơn, tuyên bố và báo cáo với trang liên tục.
- DOCX ↔ ODT cho khả năng tương tác cross-suite.
- DOCX → Markdown để xuất bản Docs công nghệ.
- PDF → PNG/JPEG/TIFF để tạo các bản xem trước hoặc hình ảnh nhỏ.
- Word/HTML → EPUB cho dòng công việc e-book.
Mẹo: Sử dụng **PageSet ** để xuất trang hoặc chuỗi cụ thể; kết hợp với ImageSaveOptions cho sprites hoặc thumbnails.
Thực hành tốt nhất
- Giấy phép đầu tiên : khởi động giấy phép đo trước bất kỳ chuyển đổi nào để tránh đánh giá điểm nước.
- Thiên thích dòng trong các dịch vụ để vượt qua đĩa I/O và giảm độ chậm.
- Được xác nhận sớm : kiểm tra các byte ma thuật hoặc cố gắng tải khô để thất bại nhanh chóng.
- **Bộ phát hành đúng kích thước : chọn DPI nhạy cảm, tránh bao gồm bất kỳ phông chữ nào trừ khi cần thiết; chọn ** PDF/A chỉ khi tuân thủ cần.
- Chế độ bảo vệ nguồn lực: Wrap
Document
và dòng chảy trongusing
Các khối. - Các khoản tiền tệ : sử dụng ngắn hạn
Document
trường hợp theo yêu cầu; sử dụng hồ bơi cho các tùy chọn nếu cần thiết. - Không thể quan sát : số lượng trang đăng ký, thời gian, và cài đặt tùy chọn; đánh dấu thất bại với ID liên quan.
FAQ
**Có cần Microsoft Office không?**Không, nó là một API độc lập.
**Tôi có thể chuyển đổi mà không chạm vào hệ thống tệp không?**Tất cả các chuyển đổi có thể là Stream → Stream.
**Làm thế nào để thực hiện PDF / A?**thiết lập PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(hoặc 2u) trước khi tiết kiệm.
**Tôi có thể bảo vệ mật khẩu của PDF không?**Có. Cài đặt mã hóa và phép lá cờ trong PdfSaveOptions
.
**Markdown round-trip có an toàn không?**Các bảng, danh sách, tiêu đề, liên kết, và định dạng inline được hỗ trợ với các tùy chọn có thể nhúng.
**Làm thế nào để chuyển đổi các trang cụ thể?**Sử dụng PageSet
trong ImageSaveOptions
hoặc FixedPageSaveOptions
‑Các lớp học dẫn nguồn.