Aspose.Words Document Converter pentru .NET

Aspose.Words Document Converter pentru .NET este o API ușoară, de înaltă performanță, care se concentrează pe format-to-format conversie. susține scenarii comune cum ar fi Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → imagini (JPG/PNG/TIFF) și zeci de altele – fără a necesita Microsoft Office.

Instalare și setare

  • Instalarea pachetului NuGet Aspose.Words (Core API care conferă conversii).
  • Aplicați o licență măsurată la startup pentru a evita limitele de evaluare: vezi Licență măsurată .
  • revizuirea cerinţelor de cadru în cadrul Ghid de instalare .

Platforme susținute

  • Sistemul de operare: Windows, Linux, macOS
  • Framework-uri: .NET 4.x, .Net Standard 2.0 , .net Core 2.0 – 3.1, .NET 5/6/7+, Mono
  • IDE: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Începe rapid

1) Cuvânt → PDF (one-linear)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF cu opțiuni

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

Cuvânt cheie: DOCX Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → imagini (pe pagină)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Stream → streaming (web/serviciu)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Caracteristici și funcționalitate

Capacitate în format larg

Introducere / ieșire (selectat):

  • Familia Word: DOC, DOCX, DOT, RTF, WordML (XML)
  • Layout fix: PDF, de la Etichetă: ePub/)

În cazul în care există atât un plugin **File Processor ** și acest Converter , puteți încărca/edita mai întâi și apoi exporta în formatul dorit.

Detectarea automată a formatului

API detectează format din titlurile de fișiere sau conținutul de flux , astfel încât să puteți accepta în siguranță încărcături arbitrare în serviciile web.

Fine-Tuning cu opțiuni de salvare

  • PDF: PDF/A‐1b/2u, criptare, steaguri de permisiune, semnături digitale, încorporarea fontului, compresia imaginii.
  • HTML/MHTML: gestionarea resurselor (embed vs. extern), modul CSS, codificarea, formatul imaginii și DPI.
  • Imagini: DPI, adâncime de culoare, compresie, gamă de pagini, multi-pagini TIFF.
  • Markdown: lista și stilurile de titlu, alinierea tabelului, generarea link-urilor.

Layout Fidelitate și Metadata

Conservă fontele, stilurile, tabelele, titlurile/footerii, marcajele de apă, comentariile, pauzele secțiunii și proprietățile documentului (autor, Titlu, câmpuri personalizate). Metadata poate fi transformată programat în timpul conversiei.

Procesare prietenoasă cu serverul

  • Stream-first API, alocări scăzute, buffer I/O.
  • Async/batch conversie și paralelizare pentru tranzit.
  • Configurați limitele de memorie și de prelucrare a paginilor pentru docuri mari.

Diagnostică și rezistență

Excepții clare cu privire la intrările corupte / nesuportate; intrarea în logging / telemetry pentru a captura durate, număr de pagini și cauze de eșec SLA de urmărire.

Rețete populare de conversie

  • **DOCX → PDF/XPS ** pentru distribuție și arhivare (opțional PDF/A).
  • HTML → PDF pentru facturile, declarațiile și rapoartele cu pagină consistentă.
  • DOCX ↔ ODT pentru interoperabilitatea cross-suite.
  • DOCX → Markdown pentru a publica documente tehnice.
  • PDF → PNG/JPEG/TIFF pentru a genera previziuni sau miniere.
  • Word/HTML → EPUB pentru fluxurile de lucru e-book.

Sfat: Utilizați PageSet pentru a exporta pagini sau ranguri specifice; combinați cuImageSaveOptions pentru sprituri sau miniere.

Cele mai bune practici

  • Licența întâi : inițializați licența măsurată înainte de orice conversii pentru a evita valorile de evaluare.
  • Preferă fluxurile în servicii pentru a trece discul I/O și a reduce latența.
  • Validați devreme : inspectați byte magice sau încercați o încărcare uscată pentru a eșua rapid.
  • Size drepte: selectați DPI sensibil, evitați încorporarea oricărei fonturi dacă nu este necesar; alegeți PDF/A numai atunci când este nevoie de conformitate.
  • Higiena resurselor : curățare Document şi fluxurile în using în blocuri.
  • Concurrență : utilizare pe termen scurt Document cazuri pe cerere; angajați piscine pentru opțiuni dacă este necesar.
  • Observabilitate : număr de pagini de jurnal, durate și seturi de opțiuni; etichetarea eșecurilor cu ID-urile de corelație.

FAQ

**Aveți nevoie de Microsoft Office?**Nu, este o API independentă.

**Pot să convertez fără a atinge sistemul de fișiere?**Toate conversiile pot fi Stream → Stream.

**Cum pot aplica PDF/A?**Setul PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (sau 2u) înainte de a economisi.

**Pot proteja pașapoartele PDF?**Da. Configurează steagurile de criptare și permisiuni în PdfSaveOptions.

**Este Markdown round-trip sigur?**Tabelele, listele, titlurile, link-urile și formatarea inline sunt susținute cu opțiuni tunabile.

**Cum pot converti pagini specifice?**Utilizarea PageSet în ImageSaveOptions sau FixedPageSaveOptions‑Clasele derivate.

 Română