Aspose.Words Dokument Konvertor pro .NET

Aspose.Words Dokument Converter pro .NET je lehká, vysoce výkonná API zaměřená na format-to-format konverze. Podporuje běžné scénáře, jako jsou Word → PDF, HTML→PDF , DOCX ↔ ODT a DOCX → Markdown i desítky dalších obrazů (JPG/PNG/TIFF) bez nutnosti Microsoft Office.

Instalace a nastavení

Podporované platformy

  • Systém: Windows, Linux a macOS
  • rámce: .NET Framework 4.x, .NET Standard 2.0, ,NET Core 2.0–3.1, .net 5/6/7+, Mono
  • IDES: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

rychlý start

1) Word → PDF (jedna linka)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF s možností

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → obrázky (na stránku)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Stream → stream (web/služba)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Funkce a funkčnost

Široký formát krytí

Vstup / výstup (vybrané):

  • Rodina slov: DOC, DOCX, DOT, RTF, WordML (XML)
  • Fixní rozložení: PDF, OTT Formáty / EPUB/)

Plná matrice se shoduje s funkcemi Aspose.Words.Pokud jsou přítomny jak **File Processor ** plugin, tak i tento Converter , můžete nejprve stáhnout/editovat a pak exportovat ve požadovaném formátu.

Automatická detekce formátu

API detekuje formát z **file headers ** nebo stream obsahu , takže můžete bezpečně přijímat svévolné nahrávání v webových službách.

Fine-Tuning s možností uložení

  • PDF: PDF/A‐1b/2u, šifrování, povolené vlajky, digitální podpisy, vložení písma, komprese obrazu.
  • HTML/MHTML: Řízení zdrojů (vnitřní vs. externí), režim CSS, kódování, formát obrazu a DPI.
  • Obrázky: DPI, barevná hloubka, komprese, rozsah stránek, multi-page TIFF.
  • Markdown: seznamy a hlavních stylů, tabulkové vyrovnání, generace odkazů.

Layout věrnost a metadata

Udržuje písmena, styly, tabulky, titulky/pohyby, vodní značky, komentáře, oddíly a dokumentní vlastnosti (autor, název, přizpůsobené pole.

Přátelské zpracování serveru

  • Stream-first API, nízké přidělování, bufferované I/O.
  • Async/batch konverze a paralelizace pro průchod.
  • Konfigurovatelná paměť a hranice zpracování stránek pro velké doky.

Diagnostika a odolnost

Jasné výjimky na zkorumpované / nepodporované vstupy; chytání do logování / telemetry k zachycení trvání, počítání stránek a důvody selhání SLA a sledování.

Populární konverzní recepty

  • **DOCX → PDF/XPS ** pro distribuci a archivování (opcionálně PDF/A).
  • HTML → PDF pro faktury, prohlášení a zprávy s konzistentní stránkou.
  • DOCX ↔ ODT pro interoperabilitu cross-suite.
  • DOCX → Markdown k publikování technických dokladů.
  • PDF → PNG/JPEG/TIFF k vytváření předpovědí nebo miniatur.
  • Word/HTML → EPUB pro pracovní toky e-knih.

Tip: Použijte **PageSet ** k vývozu konkrétních stránek nebo řad; kombinujte s ImageSaveOptions pro sprity nebo miniatury.

Nejlepší postupy

  • Licence first : zahájit měřené licence před každou konverzi, aby se zabránilo hodnocení vodních znaků.
  • Raději proudy v službách, aby se disk I/O a snížení latence.
  • Připravte se předčasně : zkontrolujte magické bajty nebo pokuste se vysušit zatížení, aby rychle selhal.
  • **Right-size output ** : vyberte citlivý DPI, vyhněte se vkládání každého písma, pokud to není nutné; zvolte PDF/A pouze v případě potřeby dodržování.
  • Hygiena zdrojů : Wrap Document a proudy v using a bloků.
  • Konkurenční měna : krátkodobé využití Document Případy na vyžádání; použijte bazény pro možnosti v případě potřeby.
  • Observovatelnost : počty záznamových stránek, trvání a nastavení možností; označování selhání s korelačními ID.

FAQ

**Potřebuje Microsoft Office?**Jde o samostatnou API.

**Můžu převést bez dotyku souborového systému?**Všechny konverze mohou být Stream → Stream.

**Jak mám provádět PDF/A?**Setování PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (nebo 2u) před ušetřením.

**Můžu heslo chránit PDF?**Ano. nastavení šifrování a povolení vlajky v PdfSaveOptions.

**Je Markdown Round-trip bezpečný?**Tabulky, seznamy, nadpisy, odkazy a inline formátování jsou podporovány tunovatelnými možnostmi.

**Jak převést konkrétní stránky?**Použití PageSet v ImageSaveOptions nebo FixedPageSaveOptions‑Odvozené třídy.

 Čeština