Aspose.Words dokumentkonverter til .NET

Aspose.Words Document Converter for .NET er en letvægtig, højpræstation API fokuseret på format-til-format konvertering. Det understøtter almindelige scenarier som Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → billeder (JPG/PNG/TIFF) og tusindvis mere – uden at kræve Microsoft Office.

Installation og installation

  • Installation af NuGet-pakken Aspose.Words (Core API styrer konverteringer).
  • Anvend målt licens på startups for at undgå evalueringsgrænser: se Målt licens .
  • Oversigt over rammevilkårene i Installationsvejledning .

Støtte platforme

  • Windows, Linux og MacOS
  • Frameworks: .NET Framework 4.x, .net Standard 2.0, ,NET Core 2.0–3.1, .NET 5/6/7+, Mono
  • IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Hurtig start

1) Word → PDF (en-liner)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF med muligheder

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → billeder (per side)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Strøm → Stream (web/tjeneste)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Funktioner og funktionalitet

Bredt format dækning

Indtjening og udgang (valgt):

  • Word familie: DOC, DOCX, DOT, RTF, WordML (XML)
  • Fikset layout: PDF, Ud af Formater og ePub/)

Hvis både en **File Processor ** plugin og denne Converter er til stede, kan du først lade/redigere og derefter eksportere i det ønskede format.

Automatisk formatdetektion

API opdager format fra **filerhovedre ** eller streamindhold , så du kan trygt acceptere vilkårlige upload i webtjenester.

Fine-Tuning med Save Options

  • PDF: PDF/A‐1b/2u, kryptering, tilladelsesflagge, digitale underskrifter, fonting, billedkompression.
  • HTML/MHTML: Ressourcehåndtering (embed vs. ekstern), CSS-modus, kodning, billedformat & DPI.
  • Billeder: DPI, farve dybde, kompression, side rækkefølge, multi-page TIFF.
  • Markdown: liste og heading stilarter, tabelliggørelse, linkgenerering.

Layout Fidelitet og Metadata

Bevarer bogstaver, stilarter, tabeller, overskrifter/footere, vandmærker, kommentarer, sektionsbrud og dokumentegenskaber (forfatter, titel, tilpassede felter.

Server-venlig behandling

  • Stream-first APIs, lave tildelinger, bufferet I/O.
  • Async/batch konvertering og parallelisering til gennemgang.
  • Konfigurerbar hukommelse og sidebehandlingsgrænser for store docs.

Diagnostik og holdbarhed

Klare undtagelser på korrupte/nedstøttede indtægter; hoke i logging/telemetri for at fange varighed, sidekontoer og manglende årsager til SLA og sporing.

Populære konverteringsrecepter

  • **DOCX → PDF/XPS ** til distribution og arkivering (alternativt PDF/A).
  • HTML → PDF for fakturaer, udtalelser og rapporter med konsekvent sidestilling.
  • DOCX ↔ ODT til cross-suite interoperabilitet.
  • DOCX → Markdown til udgivelse af teknisk dokumentation.
  • PDF → PNG/JPEG/TIFF til at generere forudsigelser eller miniatyrer.
  • Word/HTML → EPUB for e-bøger.

Tip: Brug **PageSet ** til at eksportere specifikke sider eller rækker; kombiner med ImageSaveOptions for spriter eller miniatyrer.

Bedste praksis

  • License first : initialisere målt licens før eventuelle konverteringer for at undgå evaluering af vandmærker.
  • Foretrækker strømme i tjenester til at skifte disk I/O og reducere latens.
  • Validere tidligt : inspicere magiske byte eller forsøge en tør belastning at falde hurtigt.
  • **Right-size output ** : Vælg følsom DPI, undgå at indsætte hver font, medmindre det er nødvendigt; vælg PDF/A kun, når overensstemmelse er nødvendig.
  • Resource hygiejne : Wrap Document og strømmer i using Blokkene er.
  • Konkurrence : brug kortlivet Document indstillinger efter anmodning; ansætte pooler for muligheder, hvis det er nødvendigt.
  • Observabilitet : logside tal, varighed og opsæt; tag fejl med korrelation ID’er.

FAQ

**Har du brug for Microsoft Office?**Det er en standalone API.

**Kan jeg konvertere uden at røre filsystemet?**Alle konverteringer kan være Stream → Stream.

**Hvordan kan jeg gennemføre PDF/A?**Sæt PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (eller 2u) før besparelse.

**Kan jeg beskytte PDF’er med adgangskode?**Ja. Konfigurer kryptering og tilladelse flag i PdfSaveOptions.

**Er Markdown rund-trip sikkert?**Tabeller, lister, overskrifter, links og inline formatering støttes med tunable muligheder.

**Hvordan kan jeg konvertere specifikke sider?**Brug af PageSet I ImageSaveOptions eller FixedPageSaveOptions‑afledte klasser.

 Dansk