Aspose.Words dokumentų konvertuotojas .NET
Aspose.Words Dokumentas konvertuotojas .NET yra lengvas, aukštos kokybės API, orientuotas į format-to-format konvertavimą. Jis palaiko bendrus scenarijus, tokius kaip Word → PDF, HTML → pdf**, DOCX ↔ ODT* , * DOCX → Markdown** ir PDF → vaizdai (JPG/PNG/TIFF) bei dešimtys daugiau – nereikalauja Microsoft Office.
Įdiegimas ir nustatymas
- Įdiegti NuGet paketą
Aspose.Words
(Nukreipta iš puslapio „Core API Power Conversions). - Taikykite matuotą licenciją „Startup“, kad išvengtumėte vertinimo ribų: žiūrėkite Išmatuota licencija .
- Patikrinkite pagrindinius reikalavimus Įdiegimo vadovas .
palaikomos platformos
- Windows“, „Linux“ ir „MacOS
- Framorai: .NET Framework 4.x, .Net Standard 2.0,.NET Core 2.0–3.1, .NET 5/6/7+, Mono
- IDEs: „Visual Studio 2017–2022, „JetBrains Rider“, „MonoDevelop
Greitas pradžia
1) Word → PDF (vienos linijos)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF su galimybe
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOKX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → nuotraukos (per puslapį)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) srautas → srovė (web / paslauga)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Savybės ir funkcionalumas
Plačios formos aprėptis
Įėjimas / išėjimas (pasirenkamas):
- žodžių šeima: DOC, DOCX, DOT, RTF, WordML (XML)
- Nuoseklus dizainas: PDF, Iš Šaltiniai / EPUB/)
Jei yra tiek File Processor ir šis Converter priedai, pirmiausia galite įkrauti / redaguoti ir tada eksportuoti pageidaujamu formatu.
Automatinis formatų aptikimas
API nustato formatą iš failų antraštės arba stream turinio, todėl galite saugiai priimti savavališkus įkėlimus žiniatinklio paslaugose.
Fine-Tuning“ su „Save“ galimybėmis
- PDF: PDF/A‐1b/2u, šifravimas, leidimų vėliavos, skaitmeniniai parašai, fontų įterpimo, vaizdo suspaudimas.
- HTML/MHTML: išteklių tvarkymas (įjungtas vs. išorinis), CSS režimas, kodavimas, vaizdo formatas ir DPI.
- Nuotraukos: DPI, spalvų gylis, suspaudimas, puslapių diapazonas, multi-page TIFF.
- Markdown: sąrašas ir pavadinimo stilius, lentelės suderinimas, nuorodų generavimas.
Layout Fidelity ir metadata
Išsaugo rašmenis, stilius, lenteles, antraštes / pėdkelnes, vandens ženklus, pastabas, skyrių lūkesčius ir dokumento savybes (autorius, pavadinimas, pritaikytos sritys.
Serverio draugiškas apdorojimas
- Stream-first API, žemas paskirstymas, buffered I/O.
- Async/batch konvertavimas ir paralelizacija perėjimui.
- Konfiguruojamas atminties ir puslapio apdorojimo ribos dideliems dokams.
Diagnozė ir atsparumas
Aiškios išimties dėl pažeidžiamų / nepalaikytų įrašų; įsiskverbimas į logging / telemetry užfiksuoti trukmę, puslapių skaičiavimus ir nesėkmės priežastis SLA ir sekti.
Populiariausi konvertavimo receptai
- DOCX → PDF/XPS platinimui ir archyvavimui (pageidautina PDF/A).
- HTML → PDF sąskaitoms, pareiškimams ir ataskaitoms su nuosekliu puslapiu.
- DOCX ↔ ODT tarpusavio sąveika.
- DOCX → Markdown paskelbti tech dokus.
- PDF → PNG/JPEG/TIFF, kad būtų sukurtos išankstinės peržiūros ar miniatiūriniai įrašai.
- Word/HTML → EPUB elektroninių knygų darbo srautams.
Patarimas: Naudokite PageSet eksportuoti tam tikrus puslapius ar eilutes; derinkite su ImageSaveOptions spritams ar miniatiūromis.
Geriausios praktikos
- License first: pradėti matuojamą licenciją prieš bet kokius konvertavimus, kad būtų išvengta vertinimo vandens ženklų.
- Tinkamiausias srautas paslaugose, kad būtų galima atsikratyti diskų I/O ir sumažinti latentą.
- Atidarykite anksti: patikrinkite stebuklingus bajtus arba pabandykite greitai sugadinti sausą apkrovą.
- Right-size output: pasirinkite jautrią DPI, vengti įterpti kiekvieną fontą, nebent būtina; pasirinkti PDF/A tik tada, kai reikalinga atitiktis.
- Išteklių higiena: įkrovimas
Document
ir srautas įusing
ir blokų. - Konkurencija: trumpalaikis naudojimas
Document
Pavyzdžiai pagal prašymą; jei reikia, naudokite baseinus variantams. - Atsekamumas: sąrašo puslapių skaičiai, trukmės ir parinkčių rinkinys; pažymėti nesėkmes su korelacijos ID.
FAQ
**Ar tai reikalauja „Microsoft Office?**Ne, tai yra standalone API.
**Ar galiu konvertuoti nepažeidžiant failų sistemos?**Visi konvertavimai gali būti Stream → Stream.
**Kaip galiu vykdyti PDF/A?**Set PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(arba 2u) prieš taupymą.
**Ar galiu apsaugoti slaptažodį PDF?**Taip. konfigūruokite šifravimą ir leidimų vėliavas PdfSaveOptions
.
**Ar „Markdown round-trip“ yra saugus?**Kompleksiniai išdėstymai gali būti supaprastinti. lentelės, sąrašai, antraštės, nuorodos ir inline formatavimas palaikomi tunable variantų.
**Kaip konvertuoti konkrečias puslapius?**Use PageSet
Į ImageSaveOptions
arba FixedPageSaveOptions
‑Išvestinės klasės.