Aspose.Words Document Converter voor .NET

Aspose.Words Document Converter voor .NET is een lichtgewicht, high-performance API gericht op format-to-format conversie. Het ondersteunt gemeenschappelijke scenario’s zoals Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown en PDF → afbeeldingen (JPG/PNG/TIFF), en tientallen meer - zonder Microsoft Office te vereisen.

Installatie en Setup

  • Installeer het NuGet-pakket Aspose.Words (Core API versterkt conversies).
  • Aanvragen gemeten licentie bij startups om beoordelingsgrens te vermijden: zie gemeten licentie .
  • Herziening van de kadervereisten in de Installatie gids .

Ondersteunde platforms

  • OS: Windows, Linux en macOS
  • Frameworks: .NET Framework 4.x, .Net Standard 2.0,.NET Core 2.0–3.1, .net 5/6/7+, Mono
  • IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Snelle start

1) Word → PDF (een lijn)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF met opties

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → afbeeldingen (per pagina)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Stream → stream (web / service)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Features en functionaliteit

Brede formaat bedekking

Input / Output (keuze uit):

  • Wordfamilie: DOC, DOCX, DOT, RTF, WordML (XML)
  • Fixed layout: PDF, OTT Informatie / EPUB/)

Volledige matrix is in overeenstemming met Aspose.Words-capaciteiten.Als zowel een **File Processor ** plugin als deze Converter aanwezig zijn, kunt u eerst laden/bewerken en vervolgens in het gewenste format exporteren.

Automatische Format Detectie

De API detecteert formaten van **bestandhoofden ** of streaminhoud , zodat u vrijwillige uploaden in webdiensten veilig kunt accepteren.

Fine-Tuning met Save Opties

  • PDF: PDF/A‐1b/2u, versleuteling, vergunningsvlaggen, digitale handtekeningen, fonting, beeldcompressie.
  • HTML/MHTML: Resource management (embed vs. extern), CSS-modus, codering, afbeeldingsformaat & DPI.
  • Afbeeldingen: DPI, kleur diepte, compressie, pagina range, multi-page TIFF.
  • Markdown: lijst en heading stijlen, tabel aanpassing, linkgeneratie.

Layout Fideliteit & Metadata

Behoudt lettertypen, stijlen, tabellen, header/footers, watermark, opmerkingen, sectiebreuken en documentenigenschappen (auteur, titel, aangepaste velden.

Servervriendelijke verwerking

  • Stream-first APIs, lage toewijzingen, buffer I/O.
  • Async/batch conversie en parallelisering voor doorvoer.
  • Configurable memory & page processing thresholds voor grote docs.

Diagnose en resilience

duidelijke uitzonderingen op corrupte/onbeheerde inputs; hook in logging/telemetry om de duur van de opname, pagina’s te tellen en mislukkingsredenen voor SLA en tracking.

Populaire conversie recepten

  • **DOCX → PDF/XPS ** voor distributie en archivering (optional PDF/A).
  • HTML → PDF voor facturen, verklaringen en verslagen met consistente pagina’s.
  • DOCX ↔ ODT voor cross-suite interoperabiliteit.
  • DOCX → Markdown om tech docs te publiceren.
  • PDF → PNG/JPEG/TIFF om voorbeelden of miniatures te genereren.
  • Word/HTML → EPUB voor e-book workflows.

Tip: Gebruik **PageSet ** om specifieke pagina’s of randen te exporteren; combineer met ImageSaveOptions voor sprites of thumbnails.

Beste praktijken

  • License first : initialiseren van gemeten licenties vóór elke conversie om beoordelingswatermarkeringen te vermijden.
  • Voorkeur aan stromen in diensten om de I/O schijf te verlaten en latentie te verminderen.
  • Valideer vroeg : inspecteer magische byten of probeer een droge lading snel te mislukken.
  • **Right-size output ** : kies een gevoelige DPI, vermijd elke lettertype indien niet vereist; kies PDF/A alleen wanneer naleving nodig is.
  • Resource hygiëne : wrap Document en stromen in using De blokken.
  • Concurrency : korte levensduur gebruik Document instanties per verzoek; gebruik zwembaden voor opties indien nodig.
  • Observabiliteit : logpagina tellen, duur en opties sets; tagfouten met correlatie-ID’s.

FAQ

**Heeft het Microsoft Office nodig?**Het is een standalone API.

**Kan ik converteren zonder het bestandsysteem aan te raken?**Alle conversies kunnen Stream → Stream zijn.

**Hoe kan ik PDF/A uitvoeren?**Set op PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (of 2u) voor het besparen.

**Kan ik een wachtwoord beschermen voor PDF’s?**Ja. Configureer encryptie en toestemming vlaggen in PdfSaveOptions.

**Is Markdown rond-trip veilig?**De tabellen, lijsten, header, links en inline-formaat worden ondersteund met tunable opties.

**Hoe kan ik specifieke pagina’s converteren?**Gebruik PageSet In de ImageSaveOptions of FixedPageSaveOptions‑De afgeleide klassen.

 Nederlands