Aspose.Words dokumentkonverterare för .NET
Aspose.Words Dokumentkonverter för .NET är en lätt, högpresterande API som fokuserar på format-till-formatkonversion. Det stöder vanliga scenarier som Word → PDF, HTML → pdf**, DOCX ↔ ODT* , * DOCX → Markdown** PDF → bilder (JPG/PNG/TIFF) och dussintals fler - utan att behöva Microsoft Office.
Installation och installation
- Installera NuGet-paketet
Aspose.Words
(Core API powering konverteringar). - Applicera måttlig licens vid startups för att undvika utvärderingsgränser: se Mätlicensiering .
- granskning av ramkrav i Installationsguide .
Stödda plattformar
- OS: Windows, Linux och macOS
- Frameworks: .NET Framework 4.x, .Net Standard 2.0,.NET Core 2.0–3.1, .net 5/6/7+, Mono
- IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Snabb start
1) Word → PDF (en linje)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF med alternativ
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → bilder (per sida)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
Ström → ström (webb/tjänst)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Funktioner och funktionalitet
Brett format täckning
Input / Output (väljs):
- Word familj: DOC, DOCX, DOT, RTF, WordML (XML)
- Fixad layout: PDF, OTT Föregående inlägg/Epub/)
Om både en **File Processor ** plugin och denna Converter är närvarande, kan du ladda/redigera först och sedan exportera i önskad format.
Automatisk formatdetektion
API upptäcker format från **filerhuvud ** eller ströminnehåll , så att du säkert kan acceptera frivilliga laddningar i webbtjänster.
Fine-Tuning med Spara alternativ
- PDF: PDF/A‐1b/2u, kryptering, tillståndsflaggor, digitala signaturer, fonting, bildkompression.
- HTML/MHTML: resurshantering (embed vs. extern), CSS-läge, kodning, bildformat & DPI.
- Bilder: DPI, färgdjup, kompression, sidområde, multi-page TIFF.
- Markdown: lista och heading stilar, tabell anpassning, länkgenerering.
Layout Fidelity och Metadata
Förvarar teckensnitt, stilar, tabeller, rubriker/fötter, vattenmärken, kommentarer, sektionsbrott och dokumentegenskaper (författare, titel, anpassade fält.
Servervänlig bearbetning
- Stream-first APIs, låga allokationer, buffert I/O.
- Async/batch konvertering och parallellisering för genomströmning.
- Konfigurerbara minnes- och sidbearbetningsgränser för stora docs.
Diagnos och motståndskraft
tydliga undantag på korrupta/ungödda inmatningar; hopp i logging/telemetry för att fånga varaktigheter, sidor räknas och misslyckande orsaker till SLA att spåra.
Populära konverteringsrecept
- **DOCX → PDF/XPS ** för distribution och arkivering (alternativt PDF/A).
- HTML → PDF för fakturor, uttalanden och rapporter med konsekvent sida.
- DOCX ↔ ODT för cross-suite interoperabilitet.
- DOCX → Markdown för att publicera tekniska dokument.
- PDF → PNG/JPEG/TIFF för att generera förhandsvisningar eller miniatyrer.
- Word/HTML → EPUB för e-bokarbetsflöden.
Tips: Använd PageSet för att exportera specifika sidor eller rader; kombinerar medImageSaveOptions för spriter eller miniatyrer.
Bästa praxis
- Licens först : initialisera måttlig licens före eventuella omvandlingar för att undvika utvärderingsvattenmärken.
- Föredrar strömmar i tjänster för att hoppa över I/O-skivan och minska latensen.
- Validera tidigt : Kontrollera magiska byter eller försök en torr belastning att misslyckas snabbt.
- **Right-size output ** : välj känslig DPI, undvik att infoga varje font om inte krävs; välj PDF/A endast när överensstämmelse behövs.
- Resurshygien : Wrap
Document
och strömmar iusing
och block. - Konkurrens : användning kortlivad
Document
instanser per begäran; anställa pooler för alternativ om det behövs. - Observabilitet : arkivsidan räkningar, varaktigheter och alternativ uppsättningar; tagg misslyckanden med korrelation ID.
FAQ
**Behöver det Microsoft Office?**Nej, det är en självständig API.
**Kan jag konvertera utan att röra filsystemet?**Alla omvandlingar kan vara Stream → Stream.
**Hur kan jag genomföra PDF/A?**Sätt PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(eller 2u) innan du sparar.
**Kan jag skydda lösenord för PDF-filer?**Ja. Konfigurera kryptering och tillstånd flaggor i PdfSaveOptions
.
**Är Markdown round-trip säker?**Tabeller, listor, rubriker, länkar och inlineformatering stöds med tunbara alternativ.
**Hur konverterar jag specifika sidor?**Användning PageSet
i ImageSaveOptions
eller FixedPageSaveOptions
‑Deriverade klasser.