Aspose.Words dokumentkonverter til .NET
Aspose.Words Document Converter for .NET er en letvægtig, højpræstation API fokuseret på format-til-format konvertering. Det understøtter almindelige scenarier som Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → billeder (JPG/PNG/TIFF) og tusindvis mere – uden at kræve Microsoft Office.
Installation og installation
- Installation af NuGet-pakken
Aspose.Words
(Core API styrer konverteringer). - Anvend målt licens på startups for at undgå evalueringsgrænser: se Målt licens .
- Oversigt over rammevilkårene i Installationsvejledning .
Støtte platforme
- Windows, Linux og MacOS
- Frameworks: .NET Framework 4.x, .net Standard 2.0, ,NET Core 2.0–3.1, .NET 5/6/7+, Mono
- IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Hurtig start
1) Word → PDF (en-liner)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF med muligheder
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → billeder (per side)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Strøm → Stream (web/tjeneste)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Funktioner og funktionalitet
Bredt format dækning
Indtjening og udgang (valgt):
- Word familie: DOC, DOCX, DOT, RTF, WordML (XML)
- Fikset layout: PDF, Ud af Formater og ePub/)
Hvis både en **File Processor ** plugin og denne Converter er til stede, kan du først lade/redigere og derefter eksportere i det ønskede format.
Automatisk formatdetektion
API opdager format fra **filerhovedre ** eller streamindhold , så du kan trygt acceptere vilkårlige upload i webtjenester.
Fine-Tuning med Save Options
- PDF: PDF/A‐1b/2u, kryptering, tilladelsesflagge, digitale underskrifter, fonting, billedkompression.
- HTML/MHTML: Ressourcehåndtering (embed vs. ekstern), CSS-modus, kodning, billedformat & DPI.
- Billeder: DPI, farve dybde, kompression, side rækkefølge, multi-page TIFF.
- Markdown: liste og heading stilarter, tabelliggørelse, linkgenerering.
Layout Fidelitet og Metadata
Bevarer bogstaver, stilarter, tabeller, overskrifter/footere, vandmærker, kommentarer, sektionsbrud og dokumentegenskaber (forfatter, titel, tilpassede felter.
Server-venlig behandling
- Stream-first APIs, lave tildelinger, bufferet I/O.
- Async/batch konvertering og parallelisering til gennemgang.
- Konfigurerbar hukommelse og sidebehandlingsgrænser for store docs.
Diagnostik og holdbarhed
Klare undtagelser på korrupte/nedstøttede indtægter; hoke i logging/telemetri for at fange varighed, sidekontoer og manglende årsager til SLA og sporing.
Populære konverteringsrecepter
- **DOCX → PDF/XPS ** til distribution og arkivering (alternativt PDF/A).
- HTML → PDF for fakturaer, udtalelser og rapporter med konsekvent sidestilling.
- DOCX ↔ ODT til cross-suite interoperabilitet.
- DOCX → Markdown til udgivelse af teknisk dokumentation.
- PDF → PNG/JPEG/TIFF til at generere forudsigelser eller miniatyrer.
- Word/HTML → EPUB for e-bøger.
Tip: Brug **PageSet ** til at eksportere specifikke sider eller rækker; kombiner med ImageSaveOptions for spriter eller miniatyrer.
Bedste praksis
- License first : initialisere målt licens før eventuelle konverteringer for at undgå evaluering af vandmærker.
- Foretrækker strømme i tjenester til at skifte disk I/O og reducere latens.
- Validere tidligt : inspicere magiske byte eller forsøge en tør belastning at falde hurtigt.
- **Right-size output ** : Vælg følsom DPI, undgå at indsætte hver font, medmindre det er nødvendigt; vælg PDF/A kun, når overensstemmelse er nødvendig.
- Resource hygiejne : Wrap
Document
og strømmer iusing
Blokkene er. - Konkurrence : brug kortlivet
Document
indstillinger efter anmodning; ansætte pooler for muligheder, hvis det er nødvendigt. - Observabilitet : logside tal, varighed og opsæt; tag fejl med korrelation ID’er.
FAQ
**Har du brug for Microsoft Office?**Det er en standalone API.
**Kan jeg konvertere uden at røre filsystemet?**Alle konverteringer kan være Stream → Stream.
**Hvordan kan jeg gennemføre PDF/A?**Sæt PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(eller 2u) før besparelse.
**Kan jeg beskytte PDF’er med adgangskode?**Ja. Konfigurer kryptering og tilladelse flag i PdfSaveOptions
.
**Er Markdown rund-trip sikkert?**Tabeller, lister, overskrifter, links og inline formatering støttes med tunable muligheder.
**Hvordan kan jeg konvertere specifikke sider?**Brug af PageSet
I ImageSaveOptions
eller FixedPageSaveOptions
‑afledte klasser.