Aspose.Words Document Converter pre .NET
Aspose.Words Dokument Converter pre .NET je ľahká, vysoko výkonná API zameraná na format-to-format konverziu. Podporuje bežné scenáre, ako je Word → PDF, HTML → pdf, DOCX ↔ ODT, DocX → Markdown a desiatky ďalších obrazov (JPG/PNG/TIFF) bez toho, aby vyžadovala Microsoft Office.
Inštalácia a nastavenie
- Inštalácia balíka NuGet
Aspose.Words
(Core API napájanie konverzie). - Aplikovať merané licencie na startup, aby sa zabránilo hodnotenie limity: pozri Metrické licencie .
- Preskúmať rámcové požiadavky v Inštalácia sprievodca .
Podporované platformy
- OS: Windows, Linux a MacOS
- Frameworks: .NET Framework 4.x, .Net Standard 2.0, ,NET Core 2.0–3.1, .net 5/6/7+, Mono
- IDES: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
rýchly štart
1) Word → PDF (jednorazová linka)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF s možnosťami
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → obrázky (na stránku)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
Strom → Stream (web/služba)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Funkcie a funkčnosť
Široký formát krytiny
Vstup / výstup (vyberané):
- Rodina slov: DOC, DOCX, DOT, RTF, WordML (XML)
- pevné rozloženie: PDF, OTT Šablóny / EPUB/)
Ak sú prítomné aj **File Processor ** plugin a tento Converter , môžete najprv nahrať / upraviť a potom exportovať v požadovanom formáte.
Automatická detekcia formátu
API detekuje formát z **hlavníkov súborov ** alebo streamu obsahu , takže môžete bezpečne prijať dobrovoľné nahrávky v webových službách.
Fine-Tuning s možnosťami ušetrenia
- PDF: PDF/A‐1b/2u, šifrovanie, vlajky povolenia, digitálne podpisy, vloženie písma, kompresia obrazu.
- HTML/MHTML: riadenie zdrojov (zahrnuté vs. externé), režim CSS, kódovanie, formát obrazu a DPI.
- Obrázky: DPI, farebná hĺbka, kompresia, rozsah stránok, multi-page TIFF.
- Markdown: zoznam a hlavné štýly, harmonizácia tabuľky, generácia odkazov.
Layout fidelity a metadata
Zachováva písma, štýly, tabuľky, hlavičky / stopy, vodné značky, komentáre, oddielové prerušenia a dokumentové vlastnosti (autor, názov, vlastné polia.
Server-priateľské spracovanie
- Stream-first API, nízke pridelenia, bufferované I/O.
- Async/batch konverzia a paralelizácia pre priechod.
- Konfigurovateľná pamäť a hranice spracovania stránok pre veľké doky.
Diagnóza a odolnosť
Jasné výnimky týkajúce sa korumpovaných / nepodporovaných vstupov; chytiť do logovania / telemetry na zachytenie dĺžok, počtu stránok a dôvodov zlyhania SLA na sledovanie.
Populárne recepty na konverziu
- **DOCX → PDF/XPS ** pre distribúciu a archiváciu (opcionálne PDF/A).
- HTML → PDF pre faktúry, vyhlásenia a správy s konzistentnou stránkou.
- DOCX ↔ ODT pre cross-suite interoperability.
- DOCX → Markdown na zverejnenie technických dokladov.
- PDF → PNG/JPEG/TIFF na vytvorenie predbežných zobrazení alebo miniatúr.
- Word/HTML → EPUB pre pracovné toky e-knihy.
Tip: Použite **PageSet ** na export konkrétnych stránok alebo radov; kombinujte s ImageSaveOptions pre sprity alebo miniatúry.
Najlepšie postupy
- License first : inicializovať merané licencie pred akýmikoľvek konverziami, aby sa zabránilo hodnoteniu vodných bodov.
- Preferuje toky v službách prejsť disk I/O a znížiť latenciu.
- Validácia skôr : skontrolujte magické bajty alebo pokúste sa, aby sa suchý zaťaženie rýchlo zlyhalo.
- **Right-size output ** : vyberte citlivý DPI, vyhýbajte sa vloženiu každého písma, ak nie je to potrebné; vyberiete PDF/A len vtedy, keď je potrebné dodržiavať požiadavky.
- Hygiena zdrojov : zavlažovanie
Document
a prúdy vusing
a bloky. - Konkurenčná hodnota : krátkodobé používanie
Document
Prípady na požiadanie; používať bazény pre možnosti v prípade potreby. - Observovateľnosť : záznamové čísla, dĺžky a nastavenia možností; označenie zlyhania s identifikátormi korelácie.
FAQ
**Potrebuje Microsoft Office?**Nie, je to samostatná API.
**Môžem konvertovať bez dotyku súborového systému?**Všetky konverzie môžu byť Stream → Stream.
**Ako môžem aplikovať PDF/A?**nastavenie PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(alebo 2u) pred úsporou.
**Môžem ochrániť heslo PDF?**Áno. nastaviť šifrovanie a povolenie vlajky v PdfSaveOptions
.
**Je Markdown Round-trip bezpečný?**Tabuľky, zoznamy, nadpisy, odkazy a inline formátovanie sú podporované tunovateľné možnosti.
**Ako môžem premeniť konkrétne stránky?**Použitie PageSet
v ImageSaveOptions
alebo FixedPageSaveOptions
‑Odvodené triedy.