Convertitore di documenti Aspose.Words per .NET

Aspose.Words Document Converter per .NET è un’API leggera e ad alto rendimento focalizzata sulla conversione di formato-to-format. Supporta scenari comuni come Word → PDF, HTML → pdf , DOCX ↔ ODT, DOCX → Markdown., PDF → immagini (JPG/PNG/TIFF) e decine di più – senza richiedere Microsoft Office.

Installazione e Setup

  • Installare il pacchetto NuGet Aspose.Words (Core API fornisce conversioni).
  • Applicare una licenza misurata a startup per evitare limiti di valutazione: vedi Licenza a consumo .
  • La revisione dei requisiti quadro nel Guida di installazione .

Piattaforme supportate

  • Windows, Linux e macOS
  • Frameworks: .NET Framwork 4.x, Standard 2.0, Core 2.0-3.1, Mono
  • IDE: Visual Studio 2017-2022, JetBrains Rider, MonoDevelop

Rapido inizio

1) Word → PDF (una linea)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF con le opzioni

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → immagini (per pagina)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Stream → streaming (web/servizio)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Caratteristiche e funzionalità

La copertina in formato ampio

Introduzione e uscita (selezionata):

  • Famiglia di parole: DOC, DOCX, DOT, RTF, WordML (XML)
  • Il layout è fisso: PDF, da Sito ufficiale / EPUB/)

La matrice completa si alinea con le funzionalità di Aspose.Words.Se sia un plugin **File Processor ** che questo Converter sono presenti, è possibile caricare/editare prima e poi esportare nel formato desiderato.

Dettagli di formato automatico

L’API rileva il formato dei titoli di file o dei contenuti del flusso , quindi è possibile accettare in modo sicuro i caricamenti arbitrari nei servizi web.

Fine-Tuning con le opzioni di salvataggio

  • PDF: PDF/A‐1b/2u, crittografia, bandiera di autorizzazione, firme digitali, incorporazione di font, compressione dell’immagine.
  • HTML/MHTML: gestione delle risorse (embed vs. esterno), modalità CSS, codifica, formato immagine e DPI.
  • Immagini: DPI, profondità del colore, compressione, gamma di pagine, multi-pagine TIFF.
  • Markdown: elenchi e stili di titolo, allineamento da tavolo, generazione di link.

Layout Fidelity e Metadata

Conserva fonti, stili, tabelle, headers/footers, marchi d’acqua, commenti e proprietà del documento (autore, titolo, campi personalizzati). i metadati possono essere trasformati programmaticamente durante la conversione.

Servizio di elaborazione amichevole

  • Stream-first API, basse allocazioni, buffer I/O.
  • Async/batch conversione e parallelizzazione per il passaggio.
  • Configurabile memoria e soglie di elaborazione della pagina per grandi docchi.

Diagnosi e resilienza

Escluse eccezioni su entrate corrotte/non supportate; logging/telemetry per catturare le durate, i numeri di pagine e le ragioni di fallimento Il SLA di tracciamento.

Ricette di conversione popolare

  • **DOCX → PDF/XPS ** per la distribuzione e l’archiviazione (opzionale PDF/A).
  • HTML → PDF per fatturazioni, dichiarazioni e rapporti con paginazione costante.
  • DOCX ↔ ODT per interoperabilità cross-suite.
  • DOCX → Markdown per pubblicare documenti tecnici.
  • PDF → PNG/JPEG/TIFF per generare previsioni o miniature.
  • Word/HTML → EPUB per i flussi di lavoro e-book.

Suggerimento: Utilizzare **PageSet ** per esportare pagine o ranghi specifici; combinare con ImageSaveOptions in sprit o miniature.

Migliori pratiche

  • Licenza prima : inizializzare la licenza misurata prima di qualsiasi conversione per evitare i marchi d’acqua di valutazione.
  • Preferisce i flussi nei servizi per scappare il disco I/O e ridurre la latenza.
  • Validare in anticipo : ispezionare i byti magici o cercare una carica secca per fallirsi rapidamente.
  • **Right-size output ** : selezionare DPI sensibile, evitare di incorporare ogni font se non richiesto; scegliere PDF/A solo quando è necessario il rispetto.
  • Higiene delle risorse : inchiostro Document e il flusso in using dei blocchi.
  • Concurrency : utilizzo a breve durata Document instanti su richiesta; impiegare piscine per opzioni se necessario.
  • Observabilità : numeri di pagine di registrazione, durata e set di opzioni; tag fallimenti con ID di correlazione.

FAQ

**Chi ha bisogno di Microsoft Office?**Si tratta di un’API standalone.

**Posso convertire senza toccare il file system?**Tutte le conversioni possono essere Stream → Stream.

**Come posso eseguire PDF/A?**Il set PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (o 2u) prima di risparmiare.

**Posso proteggere i file PDF con password?**Sì. Configurare le bandiere di crittografia e autorizzazione in PdfSaveOptions.

**È Markdown round-trip sicuro?**I layout complessi possono essere approximati. tabelle, elenchi, titoli, link e formattazione inline sono supportati con opzioni tunable.

**Come posso convertire pagine specifiche?**Utilizzo PageSet in ImageSaveOptions o FixedPageSaveOptions‑Le classi derivate.

 Italiano