Aspose.Words Document Converter per a .NET

Aspose.Words Document Converter per .NET és una API lleugera, d’alt rendiment centrada en la conversió de format-a-format. Suporta escenaris comuns com ara Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → imatges (JPG/PNG/TIFF) i dècades més - sense requerir Microsoft Office.

Instal·lació i configuració

  • Instal·la el paquet NuGet Aspose.Words (Core API potent conversions).
  • Aplica la llicència mesurada a la startup per evitar límits d’avaluació: veure Llicència Metrada .
  • Realitzar els requisits del marc de la Guia d’instal·lació .

Plataforma de suport

  • Operació: Windows, Linux i MacOS
  • Frameworks: .NET 4.x, .NET Standard 2.0, ,NET Core 2.0–3.1 i Mono 5/6/7
  • IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Inici ràpid

1) Word → PDF (una línia)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF amb opcions

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → imatges (per pàgina)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) El corrent → el corrent (web / servei)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Característiques i funcionalitat

Cobertura de format ampli

Entrada / sortida (seleccionada):

  • Família de paraules: DOC, DOCX, DOT, RTF, WordML (XML)
  • Disseny fix: PDF, OTT Formació / EPUB/)

La matriu completa s’alinea amb les capacitats d’Aspose.Words. Si tant un plugin de processador de fitxers com aquest convertidor estan presents, es pot carregar/editar primer i després exportar en el format desitjat.

Detecció de format automàtic

L’API detecta el format des de **títols de fitxers ** o conteniment de flux , de manera que vostè pot acceptar amb seguretat les carregades arbitràries en els serveis web.

Fine-Tuning amb opcions d’emmagatzematge

  • PDF: PDF/A‐1b/2u, xifració, banderes de permís, signatures digitals, embotellament de fonts, compressió d’imatge.
  • HTML/MHTML: Gestió de recursos (embed vs. extern), mode CSS, codificació, format d’imatge i DPI.
  • Imatges: DPI, profunditat de color, compressió, gamma de pàgines, TIFF multi-pages.
  • Markdown: llistes i estils de titulació, alineament de taula, generació de enllaços.

Layout Fidelitat i Metadades

Conserva fonts, estils, taules, encàrrecs/fots, marques d’aigua, comentaris, pauses de secció i propietats de document (autor, títol, camps personalitzats.

Processament amistós al servidor

  • Stres-primer API, al·locacions baixes, buffer I/O.
  • Async/batch conversió i paral·lelització per a la transmissió.
  • Configurable memòria i límits de processament de pàgines per a grans docs.

Diagnòstic i resiliència

Excepcions clares sobre les entrades corrompudes / no recolzades; incloure el logging / telèmetria per capturar les durades, els comptes de pàgines i les raons d’incapacitat El SLA El rastreig.

Recept de conversió popular

  • **DOCX → PDF/XPS ** per a la distribució i l’arxiu (opcionalment PDF/A).
  • HTML → PDF per a factures, declaracions i informes amb pàginació coherent.
  • DOCX ↔ ODT per a la interoperabilitat cross-suite.
  • DOCX → Markdown per publicar docs tecnològics.
  • PDF → PNG/JPEG/TIFF per generar previstes o miniatures.
  • Word/HTML → EPUB per a fluxos de treball de llibres electrònics.

Tipus: Utilitzeu **PageSet ** per exportar pàgines o rangs específics; combineu amb ImageSaveOptions en el cas d’esprits o miniatures.

Les millors pràctiques

  • Licència primer : iniciar la llicència mesurada abans de qualsevol conversió per evitar les puntuacions d’avaluació.
  • Prefereix els fluxos en els serveis per treure el disc I/O i reduir la latencia.
  • Validació precoç : inspeccionar bits màgics o intentar una càrrega seca per fracassar ràpidament.
  • **Productes de mida correcta ** : triar un DPI sensible, evitar incorporar cada font si no és necessari; escollir PDF/A només quan es requereix el compliment.
  • Higiene dels recursos : enrere Document i els fluxos en using dels blocs.
  • Concurrencia : ús de curt termini de vida Document Instàncies per sol·licitud; utilitzar piscines per a opcions si és necessari.
  • Observabilitat : comptes de pàgines de log, durades i set d’opcions; etiquetar fallades amb IDs de correlació.

FAQ

**Es requereix Microsoft Office?**No, és un standalone API.

**Puc convertir sense tocar el sistema de fitxers?**Totes les conversions poden ser Stream → Stream.

**Com puc executar PDF/A?**Set PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (o 2u) abans d’estalviar.

**Puc protegir els PDFs amb contrasenyes?**Sí. Configuració de la xifració i les banderes de permís en PdfSaveOptions.

**És Markdown round-trip segur?**Les taules, llistes, encàrrecs, enllaços i formatació en línia es donen suport amb opcions tunables.

**Com puc convertir pàgines específiques?**Use PageSet En el ImageSaveOptions o FixedPageSaveOptions‑Les classes derivades.

 Català