Aspose.Words Document Converter per a .NET
Aspose.Words Document Converter per .NET és una API lleugera, d’alt rendiment centrada en la conversió de format-a-format. Suporta escenaris comuns com ara Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → imatges (JPG/PNG/TIFF) i dècades més - sense requerir Microsoft Office.
Instal·lació i configuració
- Instal·la el paquet NuGet
Aspose.Words
(Core API potent conversions). - Aplica la llicència mesurada a la startup per evitar límits d’avaluació: veure Llicència Metrada .
- Realitzar els requisits del marc de la Guia d’instal·lació .
Plataforma de suport
- Operació: Windows, Linux i MacOS
- Frameworks: .NET 4.x, .NET Standard 2.0, ,NET Core 2.0–3.1 i Mono 5/6/7
- IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Inici ràpid
1) Word → PDF (una línia)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF amb opcions
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → imatges (per pàgina)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) El corrent → el corrent (web / servei)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Característiques i funcionalitat
Cobertura de format ampli
Entrada / sortida (seleccionada):
- Família de paraules: DOC, DOCX, DOT, RTF, WordML (XML)
- Disseny fix: PDF, OTT Formació / EPUB/)
La matriu completa s’alinea amb les capacitats d’Aspose.Words. Si tant un plugin de processador de fitxers com aquest convertidor estan presents, es pot carregar/editar primer i després exportar en el format desitjat.
Detecció de format automàtic
L’API detecta el format des de **títols de fitxers ** o conteniment de flux , de manera que vostè pot acceptar amb seguretat les carregades arbitràries en els serveis web.
Fine-Tuning amb opcions d’emmagatzematge
- PDF: PDF/A‐1b/2u, xifració, banderes de permís, signatures digitals, embotellament de fonts, compressió d’imatge.
- HTML/MHTML: Gestió de recursos (embed vs. extern), mode CSS, codificació, format d’imatge i DPI.
- Imatges: DPI, profunditat de color, compressió, gamma de pàgines, TIFF multi-pages.
- Markdown: llistes i estils de titulació, alineament de taula, generació de enllaços.
Layout Fidelitat i Metadades
Conserva fonts, estils, taules, encàrrecs/fots, marques d’aigua, comentaris, pauses de secció i propietats de document (autor, títol, camps personalitzats.
Processament amistós al servidor
- Stres-primer API, al·locacions baixes, buffer I/O.
- Async/batch conversió i paral·lelització per a la transmissió.
- Configurable memòria i límits de processament de pàgines per a grans docs.
Diagnòstic i resiliència
Excepcions clares sobre les entrades corrompudes / no recolzades; incloure el logging / telèmetria per capturar les durades, els comptes de pàgines i les raons d’incapacitat El SLA El rastreig.
Recept de conversió popular
- **DOCX → PDF/XPS ** per a la distribució i l’arxiu (opcionalment PDF/A).
- HTML → PDF per a factures, declaracions i informes amb pàginació coherent.
- DOCX ↔ ODT per a la interoperabilitat cross-suite.
- DOCX → Markdown per publicar docs tecnològics.
- PDF → PNG/JPEG/TIFF per generar previstes o miniatures.
- Word/HTML → EPUB per a fluxos de treball de llibres electrònics.
Tipus: Utilitzeu **PageSet ** per exportar pàgines o rangs específics; combineu amb ImageSaveOptions en el cas d’esprits o miniatures.
Les millors pràctiques
- Licència primer : iniciar la llicència mesurada abans de qualsevol conversió per evitar les puntuacions d’avaluació.
- Prefereix els fluxos en els serveis per treure el disc I/O i reduir la latencia.
- Validació precoç : inspeccionar bits màgics o intentar una càrrega seca per fracassar ràpidament.
- **Productes de mida correcta ** : triar un DPI sensible, evitar incorporar cada font si no és necessari; escollir PDF/A només quan es requereix el compliment.
- Higiene dels recursos : enrere
Document
i els fluxos enusing
dels blocs. - Concurrencia : ús de curt termini de vida
Document
Instàncies per sol·licitud; utilitzar piscines per a opcions si és necessari. - Observabilitat : comptes de pàgines de log, durades i set d’opcions; etiquetar fallades amb IDs de correlació.
FAQ
**Es requereix Microsoft Office?**No, és un standalone API.
**Puc convertir sense tocar el sistema de fitxers?**Totes les conversions poden ser Stream → Stream.
**Com puc executar PDF/A?**Set PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(o 2u) abans d’estalviar.
**Puc protegir els PDFs amb contrasenyes?**Sí. Configuració de la xifració i les banderes de permís en PdfSaveOptions
.
**És Markdown round-trip segur?**Les taules, llistes, encàrrecs, enllaços i formatació en línia es donen suport amb opcions tunables.
**Com puc convertir pàgines específiques?**Use PageSet
En el ImageSaveOptions
o FixedPageSaveOptions
‑Les classes derivades.