Aspose.Words Document Converter pre .NET

Aspose.Words Dokument Converter pre .NET je ľahká, vysoko výkonná API zameraná na format-to-format konverziu. Podporuje bežné scenáre, ako je Word → PDF, HTML → pdf, DOCX ↔ ODT, DocX → Markdown a desiatky ďalších obrazov (JPG/PNG/TIFF) bez toho, aby vyžadovala Microsoft Office.

Inštalácia a nastavenie

  • Inštalácia balíka NuGet Aspose.Words (Core API napájanie konverzie).
  • Aplikovať merané licencie na startup, aby sa zabránilo hodnotenie limity: pozri Metrické licencie .
  • Preskúmať rámcové požiadavky v Inštalácia sprievodca .

Podporované platformy

  • OS: Windows, Linux a MacOS
  • Frameworks: .NET Framework 4.x, .Net Standard 2.0, ,NET Core 2.0–3.1, .net 5/6/7+, Mono
  • IDES: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

rýchly štart

1) Word → PDF (jednorazová linka)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF s možnosťami

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → obrázky (na stránku)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

Strom → Stream (web/služba)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Funkcie a funkčnosť

Široký formát krytiny

Vstup / výstup (vyberané):

  • Rodina slov: DOC, DOCX, DOT, RTF, WordML (XML)
  • pevné rozloženie: PDF, OTT Šablóny / EPUB/)

Ak sú prítomné aj **File Processor ** plugin a tento Converter , môžete najprv nahrať / upraviť a potom exportovať v požadovanom formáte.

Automatická detekcia formátu

API detekuje formát z **hlavníkov súborov ** alebo streamu obsahu , takže môžete bezpečne prijať dobrovoľné nahrávky v webových službách.

Fine-Tuning s možnosťami ušetrenia

  • PDF: PDF/A‐1b/2u, šifrovanie, vlajky povolenia, digitálne podpisy, vloženie písma, kompresia obrazu.
  • HTML/MHTML: riadenie zdrojov (zahrnuté vs. externé), režim CSS, kódovanie, formát obrazu a DPI.
  • Obrázky: DPI, farebná hĺbka, kompresia, rozsah stránok, multi-page TIFF.
  • Markdown: zoznam a hlavné štýly, harmonizácia tabuľky, generácia odkazov.

Layout fidelity a metadata

Zachováva písma, štýly, tabuľky, hlavičky / stopy, vodné značky, komentáre, oddielové prerušenia a dokumentové vlastnosti (autor, názov, vlastné polia.

Server-priateľské spracovanie

  • Stream-first API, nízke pridelenia, bufferované I/O.
  • Async/batch konverzia a paralelizácia pre priechod.
  • Konfigurovateľná pamäť a hranice spracovania stránok pre veľké doky.

Diagnóza a odolnosť

Jasné výnimky týkajúce sa korumpovaných / nepodporovaných vstupov; chytiť do logovania / telemetry na zachytenie dĺžok, počtu stránok a dôvodov zlyhania SLA na sledovanie.

Populárne recepty na konverziu

  • **DOCX → PDF/XPS ** pre distribúciu a archiváciu (opcionálne PDF/A).
  • HTML → PDF pre faktúry, vyhlásenia a správy s konzistentnou stránkou.
  • DOCX ↔ ODT pre cross-suite interoperability.
  • DOCX → Markdown na zverejnenie technických dokladov.
  • PDF → PNG/JPEG/TIFF na vytvorenie predbežných zobrazení alebo miniatúr.
  • Word/HTML → EPUB pre pracovné toky e-knihy.

Tip: Použite **PageSet ** na export konkrétnych stránok alebo radov; kombinujte s ImageSaveOptions pre sprity alebo miniatúry.

Najlepšie postupy

  • License first : inicializovať merané licencie pred akýmikoľvek konverziami, aby sa zabránilo hodnoteniu vodných bodov.
  • Preferuje toky v službách prejsť disk I/O a znížiť latenciu.
  • Validácia skôr : skontrolujte magické bajty alebo pokúste sa, aby sa suchý zaťaženie rýchlo zlyhalo.
  • **Right-size output ** : vyberte citlivý DPI, vyhýbajte sa vloženiu každého písma, ak nie je to potrebné; vyberiete PDF/A len vtedy, keď je potrebné dodržiavať požiadavky.
  • Hygiena zdrojov : zavlažovanie Document a prúdy v using a bloky.
  • Konkurenčná hodnota : krátkodobé používanie Document Prípady na požiadanie; používať bazény pre možnosti v prípade potreby.
  • Observovateľnosť : záznamové čísla, dĺžky a nastavenia možností; označenie zlyhania s identifikátormi korelácie.

FAQ

**Potrebuje Microsoft Office?**Nie, je to samostatná API.

**Môžem konvertovať bez dotyku súborového systému?**Všetky konverzie môžu byť Stream → Stream.

**Ako môžem aplikovať PDF/A?**nastavenie PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (alebo 2u) pred úsporou.

**Môžem ochrániť heslo PDF?**Áno. nastaviť šifrovanie a povolenie vlajky v PdfSaveOptions.

**Je Markdown Round-trip bezpečný?**Tabuľky, zoznamy, nadpisy, odkazy a inline formátovanie sú podporované tunovateľné možnosti.

**Ako môžem premeniť konkrétne stránky?**Použitie PageSet v ImageSaveOptions alebo FixedPageSaveOptions‑Odvodené triedy.

 Slovenčina