Aspose.Words dokumentų konvertuotojas .NET

Aspose.Words Dokumentas konvertuotojas .NET yra lengvas, aukštos kokybės API, orientuotas į format-to-format konvertavimą. Jis palaiko bendrus scenarijus, tokius kaip Word → PDF, HTML → pdf**, DOCX ↔ ODT* , * DOCX → Markdown** ir PDF → vaizdai (JPG/PNG/TIFF) bei dešimtys daugiau – nereikalauja Microsoft Office.

Įdiegimas ir nustatymas

  • Įdiegti NuGet paketą Aspose.Words (Nukreipta iš puslapio „Core API Power Conversions).
  • Taikykite matuotą licenciją „Startup“, kad išvengtumėte vertinimo ribų: žiūrėkite Išmatuota licencija .
  • Patikrinkite pagrindinius reikalavimus Įdiegimo vadovas .

palaikomos platformos

  • Windows“, „Linux“ ir „MacOS
  • Framorai: .NET Framework 4.x, .Net Standard 2.0,.NET Core 2.0–3.1, .NET 5/6/7+, Mono
  • IDEs: „Visual Studio 2017–2022, „JetBrains Rider“, „MonoDevelop

Greitas pradžia

1) Word → PDF (vienos linijos)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF su galimybe

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOKX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → nuotraukos (per puslapį)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) srautas → srovė (web / paslauga)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Savybės ir funkcionalumas

Plačios formos aprėptis

Įėjimas / išėjimas (pasirenkamas):

  • žodžių šeima: DOC, DOCX, DOT, RTF, WordML (XML)
  • Nuoseklus dizainas: PDF, Šaltiniai / EPUB/)

Jei yra tiek File Processor ir šis Converter priedai, pirmiausia galite įkrauti / redaguoti ir tada eksportuoti pageidaujamu formatu.

Automatinis formatų aptikimas

API nustato formatą iš failų antraštės arba stream turinio, todėl galite saugiai priimti savavališkus įkėlimus žiniatinklio paslaugose.

Fine-Tuning“ su „Save“ galimybėmis

  • PDF: PDF/A‐1b/2u, šifravimas, leidimų vėliavos, skaitmeniniai parašai, fontų įterpimo, vaizdo suspaudimas.
  • HTML/MHTML: išteklių tvarkymas (įjungtas vs. išorinis), CSS režimas, kodavimas, vaizdo formatas ir DPI.
  • Nuotraukos: DPI, spalvų gylis, suspaudimas, puslapių diapazonas, multi-page TIFF.
  • Markdown: sąrašas ir pavadinimo stilius, lentelės suderinimas, nuorodų generavimas.

Layout Fidelity ir metadata

Išsaugo rašmenis, stilius, lenteles, antraštes / pėdkelnes, vandens ženklus, pastabas, skyrių lūkesčius ir dokumento savybes (autorius, pavadinimas, pritaikytos sritys.

Serverio draugiškas apdorojimas

  • Stream-first API, žemas paskirstymas, buffered I/O.
  • Async/batch konvertavimas ir paralelizacija perėjimui.
  • Konfiguruojamas atminties ir puslapio apdorojimo ribos dideliems dokams.

Diagnozė ir atsparumas

Aiškios išimties dėl pažeidžiamų / nepalaikytų įrašų; įsiskverbimas į logging / telemetry užfiksuoti trukmę, puslapių skaičiavimus ir nesėkmės priežastis SLA ir sekti.

Populiariausi konvertavimo receptai

  • DOCX → PDF/XPS platinimui ir archyvavimui (pageidautina PDF/A).
  • HTML → PDF sąskaitoms, pareiškimams ir ataskaitoms su nuosekliu puslapiu.
  • DOCX ↔ ODT tarpusavio sąveika.
  • DOCX → Markdown paskelbti tech dokus.
  • PDF → PNG/JPEG/TIFF, kad būtų sukurtos išankstinės peržiūros ar miniatiūriniai įrašai.
  • Word/HTML → EPUB elektroninių knygų darbo srautams.

Patarimas: Naudokite PageSet eksportuoti tam tikrus puslapius ar eilutes; derinkite su ImageSaveOptions spritams ar miniatiūromis.

Geriausios praktikos

  • License first: pradėti matuojamą licenciją prieš bet kokius konvertavimus, kad būtų išvengta vertinimo vandens ženklų.
  • Tinkamiausias srautas paslaugose, kad būtų galima atsikratyti diskų I/O ir sumažinti latentą.
  • Atidarykite anksti: patikrinkite stebuklingus bajtus arba pabandykite greitai sugadinti sausą apkrovą.
  • Right-size output: pasirinkite jautrią DPI, vengti įterpti kiekvieną fontą, nebent būtina; pasirinkti PDF/A tik tada, kai reikalinga atitiktis.
  • Išteklių higiena: įkrovimas Document ir srautas į using ir blokų.
  • Konkurencija: trumpalaikis naudojimas Document Pavyzdžiai pagal prašymą; jei reikia, naudokite baseinus variantams.
  • Atsekamumas: sąrašo puslapių skaičiai, trukmės ir parinkčių rinkinys; pažymėti nesėkmes su korelacijos ID.

FAQ

**Ar tai reikalauja „Microsoft Office?**Ne, tai yra standalone API.

**Ar galiu konvertuoti nepažeidžiant failų sistemos?**Visi konvertavimai gali būti Stream → Stream.

**Kaip galiu vykdyti PDF/A?**Set PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (arba 2u) prieš taupymą.

**Ar galiu apsaugoti slaptažodį PDF?**Taip. konfigūruokite šifravimą ir leidimų vėliavas PdfSaveOptions.

**Ar „Markdown round-trip“ yra saugus?**Kompleksiniai išdėstymai gali būti supaprastinti. lentelės, sąrašai, antraštės, nuorodos ir inline formatavimas palaikomi tunable variantų.

**Kaip konvertuoti konkrečias puslapius?**Use PageSet Į ImageSaveOptions arba FixedPageSaveOptions‑Išvestinės klasės.

 Lietuvių