Pengonversi Dokumen Aspose.Words untuk .NET
Aspose.Words Document Converter untuk .NET adalah API ringan, berprestasi tinggi yang berfokus pada format-to-format conversion.Ia mendukung skenario umum seperti Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → gambar (JPG/PNG/TIFF) dan puluhan lagi – tanpa memerlukan Microsoft Office.Bangun untuk server dan cloud workloads, ia menyediakan output deterministic, penggunaan memori rendah, dan stream-first workflows.
Instalasi dan Setup
- Menginstal paket NuGet
Aspose.Words
(Core API yang memungkinkan konversi). - Memohon lisensi terukur di startup untuk menghindari batas evaluasi: lihat Lisensi Terukur .
- Memeriksa persyaratan kerangka kerja dalam Panduan Instalasi .
Platform yang didukung
- Sistem operasi: Windows, Linux, MacOS
- Bingkai: .NET Framework 4.x, .Net Standard 2.0, Core 2.0–3.1 dan Mono 5/6/7
- IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Mulai Cepat
1) Word → PDF (satu baris)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF dengan opsi
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX dan Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → gambar (per halaman)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Stream → streaming (web / layanan)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Fitur dan Fungsi
Format Penutup
Input dan output (dipilih):
- Keluarga Word: DOC, DOCX, DOT, RTF, WordML (XML)
- Layout tetap: PDF, dari Informasi / ePub/)
Matriks penuh disesuaikan dengan kemampuan Aspose.Words.Jika kedua plugin **File Processor ** dan ini Converter hadir, Anda dapat memuat / mengedit terlebih dahulu dan kemudian mengekspor dalam format yang diinginkan.
Deteksi Format otomatis
API mengidentifikasi format dari **file headers ** atau stream content , sehingga Anda dapat dengan aman menerima upload arbitrary di layanan web.
Fine-Tuning dengan Save Options
- PDF: PDF/A‐1b/2u, enkripsi, bendera izin, tandatangan digital, font embedding, kompresi gambar.
- HTML/MHTML: Manajemen sumber daya (embed vs. eksternal), mode CSS, pengekodan, format gambar & DPI.
- Gambar: DPI, kedalaman warna, kompresi, julat halaman, multi-page TIFF.
- Markdown: daftar dan gaya tajuk, alignment tabel, link generation.
Layout Fidelity & Metadata
Menyimpan font, gaya, tabel, headers/footers, watermark, komentar, breaks section, dan dokumen sifat (penulis, judul, bidang yang disesuaikan.
Pemrosesan Servis-Friendly
- Stream-first API, alokasi rendah, buffer I/O.
- Async/batch konversi dan paralelisasi untuk transmisi.
- Mengkonfigurasi memori & batas pemrosesan halaman untuk docs besar.
Diagnosis & Resiliensi
Pengecualian yang jelas pada input yang rosak/tidak didukung; melompat ke logging/telemetry untuk menangkap durasi, menghitung halaman, dan alasan kegagalan untuk SLA untuk tracking.
Resep Konversi Populer
- **DOCX → PDF/XPS ** untuk distribusi & penyimpanan (optional PDF/A).
- HTML → PDF untuk invois, pernyataan, dan laporan dengan halaman yang konsisten.
- DOCX ↔ ODT untuk interoperabilitas cross-suite.
- DOCX → Markdown untuk menerbitkan dokumen teknologi.
- PDF → PNG/JPEG/TIFF untuk menghasilkan preview atau miniatur.
- Word/HTML → EPUB untuk aliran kerja e-book.
Petua: Gunakan **PageSet ** untuk mengekspor halaman atau rangkaian tertentu; gabungkan dengan ImageSaveOptions bagi sprit atau thumbnails.
Praktik Terbaik
- Lisensi pertama : memulai lisensial yang diukur sebelum konversi apa pun untuk menghindari penilaian watermark.
- Mengutamakan aliran di layanan untuk melepaskan cakera I/O dan mengurangi latensi.
- Validate early : memeriksa byte sihir atau mencoba beban kering untuk gagal dengan cepat.
- **Kekuatan saiz kanan ** : pilih DPI sensitif, hindari memasukkan setiap font jika tidak diperlukan; pilih PDF/A hanya ketika pematuhan diperlukan.
- Higiene sumber daya : wrap
Document
dan mengalir diusing
dengan blok. - Konkuren : penggunaan jangka pendek
Document
contoh per permintaan; menggunakan kolam untuk opsi jika perlu. - Pengamatan : jumlah halaman log, durasi, dan set opsi; menandai kegagalan dengan ID korelasi.
FAQ
**Apakah Anda memerlukan Microsoft Office?**Tidak, itu adalah api standalone.
**Bolehkah saya konversi tanpa menyentuh sistem file?**Semua konversi dapat menjadi Stream → Stream.
**Bagaimana saya mengimplementasikan PDF/A?**Set yang PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(atau 2u) sebelum penyimpanan.
**Bolehkah saya melindungi kata sandi dari PDF?**Ya. mengkonfigurasi enkripsi dan izin bendera di PdfSaveOptions
.
**Apakah Markdown round-trip aman?**Tabel, daftar, tajuk, tautan, dan format inline disokong dengan pilihan tunable.
**Bagaimana saya mengubah halaman tertentu?**Penggunaan PageSet
dalam ImageSaveOptions
atau FixedPageSaveOptions
‑Kelas yang berasal.