Aspose.Words Dokument Konvertor pro .NET
Aspose.Words Dokument Converter pro .NET je lehká, vysoce výkonná API zaměřená na format-to-format konverze. Podporuje běžné scénáře, jako jsou Word → PDF, HTML→PDF , DOCX ↔ ODT a DOCX → Markdown i desítky dalších obrazů (JPG/PNG/TIFF) bez nutnosti Microsoft Office.
Instalace a nastavení
- Instalace balíčku NuGet
Aspose.Words
(Core API ovládá konverze). - Aplikujte měřené licence na startupu, abyste se vyhnuli hodnotícímu limitu: viz Licencování na bázi měření .
- Přezkoumání rámcových požadavků na Instalační průvodce .
Podporované platformy
- Systém: Windows, Linux a macOS
- rámce: .NET Framework 4.x, .NET Standard 2.0, ,NET Core 2.0–3.1, .net 5/6/7+, Mono
- IDES: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
rychlý start
1) Word → PDF (jedna linka)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF s možností
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → obrázky (na stránku)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Stream → stream (web/služba)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Funkce a funkčnost
Široký formát krytí
Vstup / výstup (vybrané):
- Rodina slov: DOC, DOCX, DOT, RTF, WordML (XML)
- Fixní rozložení: PDF, OTT Formáty / EPUB/)
Plná matrice se shoduje s funkcemi Aspose.Words.Pokud jsou přítomny jak **File Processor ** plugin, tak i tento Converter , můžete nejprve stáhnout/editovat a pak exportovat ve požadovaném formátu.
Automatická detekce formátu
API detekuje formát z **file headers ** nebo stream obsahu , takže můžete bezpečně přijímat svévolné nahrávání v webových službách.
Fine-Tuning s možností uložení
- PDF: PDF/A‐1b/2u, šifrování, povolené vlajky, digitální podpisy, vložení písma, komprese obrazu.
- HTML/MHTML: Řízení zdrojů (vnitřní vs. externí), režim CSS, kódování, formát obrazu a DPI.
- Obrázky: DPI, barevná hloubka, komprese, rozsah stránek, multi-page TIFF.
- Markdown: seznamy a hlavních stylů, tabulkové vyrovnání, generace odkazů.
Layout věrnost a metadata
Udržuje písmena, styly, tabulky, titulky/pohyby, vodní značky, komentáře, oddíly a dokumentní vlastnosti (autor, název, přizpůsobené pole.
Přátelské zpracování serveru
- Stream-first API, nízké přidělování, bufferované I/O.
- Async/batch konverze a paralelizace pro průchod.
- Konfigurovatelná paměť a hranice zpracování stránek pro velké doky.
Diagnostika a odolnost
Jasné výjimky na zkorumpované / nepodporované vstupy; chytání do logování / telemetry k zachycení trvání, počítání stránek a důvody selhání SLA a sledování.
Populární konverzní recepty
- **DOCX → PDF/XPS ** pro distribuci a archivování (opcionálně PDF/A).
- HTML → PDF pro faktury, prohlášení a zprávy s konzistentní stránkou.
- DOCX ↔ ODT pro interoperabilitu cross-suite.
- DOCX → Markdown k publikování technických dokladů.
- PDF → PNG/JPEG/TIFF k vytváření předpovědí nebo miniatur.
- Word/HTML → EPUB pro pracovní toky e-knih.
Tip: Použijte **PageSet ** k vývozu konkrétních stránek nebo řad; kombinujte s ImageSaveOptions pro sprity nebo miniatury.
Nejlepší postupy
- Licence first : zahájit měřené licence před každou konverzi, aby se zabránilo hodnocení vodních znaků.
- Raději proudy v službách, aby se disk I/O a snížení latence.
- Připravte se předčasně : zkontrolujte magické bajty nebo pokuste se vysušit zatížení, aby rychle selhal.
- **Right-size output ** : vyberte citlivý DPI, vyhněte se vkládání každého písma, pokud to není nutné; zvolte PDF/A pouze v případě potřeby dodržování.
- Hygiena zdrojů : Wrap
Document
a proudy vusing
a bloků. - Konkurenční měna : krátkodobé využití
Document
Případy na vyžádání; použijte bazény pro možnosti v případě potřeby. - Observovatelnost : počty záznamových stránek, trvání a nastavení možností; označování selhání s korelačními ID.
FAQ
**Potřebuje Microsoft Office?**Jde o samostatnou API.
**Můžu převést bez dotyku souborového systému?**Všechny konverze mohou být Stream → Stream.
**Jak mám provádět PDF/A?**Setování PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(nebo 2u) před ušetřením.
**Můžu heslo chránit PDF?**Ano. nastavení šifrování a povolení vlajky v PdfSaveOptions
.
**Je Markdown Round-trip bezpečný?**Tabulky, seznamy, nadpisy, odkazy a inline formátování jsou podporovány tunovatelnými možnostmi.
**Jak převést konkrétní stránky?**Použití PageSet
v ImageSaveOptions
nebo FixedPageSaveOptions
‑Odvozené třídy.