Convertitore di documenti Aspose.Words per .NET
Aspose.Words Document Converter per .NET è un’API leggera e ad alto rendimento focalizzata sulla conversione di formato-to-format. Supporta scenari comuni come Word → PDF, HTML → pdf , DOCX ↔ ODT, DOCX → Markdown., PDF → immagini (JPG/PNG/TIFF) e decine di più – senza richiedere Microsoft Office.
Installazione e Setup
- Installare il pacchetto NuGet
Aspose.Words
(Core API fornisce conversioni). - Applicare una licenza misurata a startup per evitare limiti di valutazione: vedi Licenza a consumo .
- La revisione dei requisiti quadro nel Guida di installazione .
Piattaforme supportate
- Windows, Linux e macOS
- Frameworks: .NET Framwork 4.x, Standard 2.0, Core 2.0-3.1, Mono
- IDE: Visual Studio 2017-2022, JetBrains Rider, MonoDevelop
Rapido inizio
1) Word → PDF (una linea)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF con le opzioni
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → immagini (per pagina)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Stream → streaming (web/servizio)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Caratteristiche e funzionalità
La copertina in formato ampio
Introduzione e uscita (selezionata):
- Famiglia di parole: DOC, DOCX, DOT, RTF, WordML (XML)
- Il layout è fisso: PDF, da Sito ufficiale / EPUB/)
La matrice completa si alinea con le funzionalità di Aspose.Words.Se sia un plugin **File Processor ** che questo Converter sono presenti, è possibile caricare/editare prima e poi esportare nel formato desiderato.
Dettagli di formato automatico
L’API rileva il formato dei titoli di file o dei contenuti del flusso , quindi è possibile accettare in modo sicuro i caricamenti arbitrari nei servizi web.
Fine-Tuning con le opzioni di salvataggio
- PDF: PDF/A‐1b/2u, crittografia, bandiera di autorizzazione, firme digitali, incorporazione di font, compressione dell’immagine.
- HTML/MHTML: gestione delle risorse (embed vs. esterno), modalità CSS, codifica, formato immagine e DPI.
- Immagini: DPI, profondità del colore, compressione, gamma di pagine, multi-pagine TIFF.
- Markdown: elenchi e stili di titolo, allineamento da tavolo, generazione di link.
Layout Fidelity e Metadata
Conserva fonti, stili, tabelle, headers/footers, marchi d’acqua, commenti e proprietà del documento (autore, titolo, campi personalizzati). i metadati possono essere trasformati programmaticamente durante la conversione.
Servizio di elaborazione amichevole
- Stream-first API, basse allocazioni, buffer I/O.
- Async/batch conversione e parallelizzazione per il passaggio.
- Configurabile memoria e soglie di elaborazione della pagina per grandi docchi.
Diagnosi e resilienza
Escluse eccezioni su entrate corrotte/non supportate; logging/telemetry per catturare le durate, i numeri di pagine e le ragioni di fallimento Il SLA di tracciamento.
Ricette di conversione popolare
- **DOCX → PDF/XPS ** per la distribuzione e l’archiviazione (opzionale PDF/A).
- HTML → PDF per fatturazioni, dichiarazioni e rapporti con paginazione costante.
- DOCX ↔ ODT per interoperabilità cross-suite.
- DOCX → Markdown per pubblicare documenti tecnici.
- PDF → PNG/JPEG/TIFF per generare previsioni o miniature.
- Word/HTML → EPUB per i flussi di lavoro e-book.
Suggerimento: Utilizzare **PageSet ** per esportare pagine o ranghi specifici; combinare con ImageSaveOptions in sprit o miniature.
Migliori pratiche
- Licenza prima : inizializzare la licenza misurata prima di qualsiasi conversione per evitare i marchi d’acqua di valutazione.
- Preferisce i flussi nei servizi per scappare il disco I/O e ridurre la latenza.
- Validare in anticipo : ispezionare i byti magici o cercare una carica secca per fallirsi rapidamente.
- **Right-size output ** : selezionare DPI sensibile, evitare di incorporare ogni font se non richiesto; scegliere PDF/A solo quando è necessario il rispetto.
- Higiene delle risorse : inchiostro
Document
e il flusso inusing
dei blocchi. - Concurrency : utilizzo a breve durata
Document
instanti su richiesta; impiegare piscine per opzioni se necessario. - Observabilità : numeri di pagine di registrazione, durata e set di opzioni; tag fallimenti con ID di correlazione.
FAQ
**Chi ha bisogno di Microsoft Office?**Si tratta di un’API standalone.
**Posso convertire senza toccare il file system?**Tutte le conversioni possono essere Stream → Stream.
**Come posso eseguire PDF/A?**Il set PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(o 2u) prima di risparmiare.
**Posso proteggere i file PDF con password?**Sì. Configurare le bandiere di crittografia e autorizzazione in PdfSaveOptions
.
**È Markdown round-trip sicuro?**I layout complessi possono essere approximati. tabelle, elenchi, titoli, link e formattazione inline sono supportati con opzioni tunable.
**Come posso convertire pagine specifiche?**Utilizzo PageSet
in ImageSaveOptions
o FixedPageSaveOptions
‑Le classi derivate.