Aspose.Words Document Converter voor .NET
Aspose.Words Document Converter voor .NET is een lichtgewicht, high-performance API gericht op format-to-format conversie. Het ondersteunt gemeenschappelijke scenario’s zoals Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown en PDF → afbeeldingen (JPG/PNG/TIFF), en tientallen meer - zonder Microsoft Office te vereisen.
Installatie en Setup
- Installeer het NuGet-pakket
Aspose.Words
(Core API versterkt conversies). - Aanvragen gemeten licentie bij startups om beoordelingsgrens te vermijden: zie gemeten licentie .
- Herziening van de kadervereisten in de Installatie gids .
Ondersteunde platforms
- OS: Windows, Linux en macOS
- Frameworks: .NET Framework 4.x, .Net Standard 2.0,.NET Core 2.0–3.1, .net 5/6/7+, Mono
- IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Snelle start
1) Word → PDF (een lijn)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF met opties
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → afbeeldingen (per pagina)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Stream → stream (web / service)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Features en functionaliteit
Brede formaat bedekking
Input / Output (keuze uit):
- Wordfamilie: DOC, DOCX, DOT, RTF, WordML (XML)
- Fixed layout: PDF, OTT Informatie / EPUB/)
Volledige matrix is in overeenstemming met Aspose.Words-capaciteiten.Als zowel een **File Processor ** plugin als deze Converter aanwezig zijn, kunt u eerst laden/bewerken en vervolgens in het gewenste format exporteren.
Automatische Format Detectie
De API detecteert formaten van **bestandhoofden ** of streaminhoud , zodat u vrijwillige uploaden in webdiensten veilig kunt accepteren.
Fine-Tuning met Save Opties
- PDF: PDF/A‐1b/2u, versleuteling, vergunningsvlaggen, digitale handtekeningen, fonting, beeldcompressie.
- HTML/MHTML: Resource management (embed vs. extern), CSS-modus, codering, afbeeldingsformaat & DPI.
- Afbeeldingen: DPI, kleur diepte, compressie, pagina range, multi-page TIFF.
- Markdown: lijst en heading stijlen, tabel aanpassing, linkgeneratie.
Layout Fideliteit & Metadata
Behoudt lettertypen, stijlen, tabellen, header/footers, watermark, opmerkingen, sectiebreuken en documentenigenschappen (auteur, titel, aangepaste velden.
Servervriendelijke verwerking
- Stream-first APIs, lage toewijzingen, buffer I/O.
- Async/batch conversie en parallelisering voor doorvoer.
- Configurable memory & page processing thresholds voor grote docs.
Diagnose en resilience
duidelijke uitzonderingen op corrupte/onbeheerde inputs; hook in logging/telemetry om de duur van de opname, pagina’s te tellen en mislukkingsredenen voor SLA en tracking.
Populaire conversie recepten
- **DOCX → PDF/XPS ** voor distributie en archivering (optional PDF/A).
- HTML → PDF voor facturen, verklaringen en verslagen met consistente pagina’s.
- DOCX ↔ ODT voor cross-suite interoperabiliteit.
- DOCX → Markdown om tech docs te publiceren.
- PDF → PNG/JPEG/TIFF om voorbeelden of miniatures te genereren.
- Word/HTML → EPUB voor e-book workflows.
Tip: Gebruik **PageSet ** om specifieke pagina’s of randen te exporteren; combineer met ImageSaveOptions voor sprites of thumbnails.
Beste praktijken
- License first : initialiseren van gemeten licenties vóór elke conversie om beoordelingswatermarkeringen te vermijden.
- Voorkeur aan stromen in diensten om de I/O schijf te verlaten en latentie te verminderen.
- Valideer vroeg : inspecteer magische byten of probeer een droge lading snel te mislukken.
- **Right-size output ** : kies een gevoelige DPI, vermijd elke lettertype indien niet vereist; kies PDF/A alleen wanneer naleving nodig is.
- Resource hygiëne : wrap
Document
en stromen inusing
De blokken. - Concurrency : korte levensduur gebruik
Document
instanties per verzoek; gebruik zwembaden voor opties indien nodig. - Observabiliteit : logpagina tellen, duur en opties sets; tagfouten met correlatie-ID’s.
FAQ
**Heeft het Microsoft Office nodig?**Het is een standalone API.
**Kan ik converteren zonder het bestandsysteem aan te raken?**Alle conversies kunnen Stream → Stream zijn.
**Hoe kan ik PDF/A uitvoeren?**Set op PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(of 2u) voor het besparen.
**Kan ik een wachtwoord beschermen voor PDF’s?**Ja. Configureer encryptie en toestemming vlaggen in PdfSaveOptions
.
**Is Markdown rond-trip veilig?**De tabellen, lijsten, header, links en inline-formaat worden ondersteund met tunable opties.
**Hoe kan ik specifieke pagina’s converteren?**Gebruik PageSet
In de ImageSaveOptions
of FixedPageSaveOptions
‑De afgeleide klassen.