Aspose.Words Convertidor de Documentos para .NET
Aspose.Words Document Converter para .NET es una API ligera y de alto rendimiento que se centra en la conversión de formato a formato.Suporta escenarios comunes como Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → imágenes (JPG/PNG/TIFF) y decenas de más – sin requerir Microsoft Office.
Instalación y configuración
- Instalar el paquete NuGet
Aspose.Words
(Core API que potencia las conversiones). - Aplique una licencia medida en la startup para evitar límites de evaluación: ver Licenciamiento Medido .
- Revisión de los requisitos de marco en el Guía de instalación .
Las plataformas apoyadas
- Windows, Linux y MacOS
- Frameworks: .NET Framework 4.x, .NET Standard 2.0, ,NET Core 2.0–3.1, .net 5/6/7+, Mono
- IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Inicio rápido
1) Word → PDF (una línea)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF con opciones
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → imágenes (por página)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
El flujo de Internet (web / service)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Características y Funcionalidad
Cobertura en formato amplio
Entrada y salida (seleccionados):
- Familia de palabras: DOC, DOCX, DOT, RTF, WordML (XML)
- Layout fijo: PDF, OTT Página web / EPUB/)
La matriz completa se alinea con las capacidades de Aspose.Words.Si ambos están presentes un plugin de procesador de archivos y este convertidor, puede cargar/editar primero y luego exportar en el formato deseado.
Detección de formato automático
La API detecta el formato de los titulares de archivo o el contenido de corriente , por lo que puede aceptar de forma segura las cargas arbitrarias en los servicios web.
Fine-Tuning con Opciones de Salvación
- PDF: PDF/A‐1b/2u, cifrado, banderas de permiso, firmas digitales, incorporación de fuentes, compresión de imágenes.
- HTML/MHTML: manejo de recursos (embed vs. externo), modo CSS, codificación, formato de imagen y DPI.
- Imajes: DPI, profundidad de color, compresión, rango de página, TIFF multi-página.
- Markdown: listas y estilos de encabezamiento, alineación de mesa, generación de enlaces.
Fidelidad y Metadatos
Conserva fuentes, estilos, tablas, header/footers, marcadores de agua, comentarios, brechas de sección, y propiedades de documento (autor, título, campos personalizados.
Procesamiento amistoso con el servidor
- APIs de flujo-primer , bajas alocaciones, bufferado I/O.
- Async/batch conversión y paralelización para la transmisión.
- Configurable memoria y límites de procesamiento de páginas para grandes doces.
Diagnóstico y resistencia
Excepciones claras sobre las entradas corrompidas/insueltas; logging/telemetry para capturar duraderas, cuentas de páginas y razones de fracaso SLA El rastreamiento.
Recetas de conversión popular
- **DOCX → PDF/XPS ** para distribución y archivo (opcionalmente PDF/A).
- HTML → PDF para las facturas, declaraciones y informes con una página consistente.
- DOCX ↔ ODT para la interoperabilidad cross-suite.
- DOCX → Markdown para publicar doces de tecnología.
- PDF → PNG/JPEG/TIFF para generar previstas o miniaturas.
- Word/HTML → EPUB para flujos de trabajo de e-book.
Consejo: Utilice **PageSet ** para exportar páginas o ramas específicas; combine con ImageSaveOptions en el caso de espritos o miniaturas.
Mejores Prácticas
- License primero : inicia la licencia medida antes de cualquier conversión para evitar las puntuaciones de evaluación.
- Preferir los flujos en los servicios para escapar del disco I/O y reducir la latencia.
- Valida temprano : inspecciona los bajos mágicos o intenta una carga seca para fracasar rápidamente.
- **Procedimiento de tamaño derecho ** : seleccione un DPI sensible, evite incorporar cada font si no es necesario; selecciona PDF/A sólo cuando se requiere el cumplimiento.
- Higiene de los recursos : Wrap
Document
y los flujos enusing
Los bloques. - Concurrencia : uso a corto plazo
Document
instantes por solicitud; emplear piscinas para opciones si es necesario. - Observabilidad : números de página de registro, duraderas y conjuntos de opciones; etiquetando fallos con IDs de correlación.
FAQ
**Es necesario Microsoft Office?**No. Es un standalone API.
**Puedo convertir sin tocar el sistema de archivos?**Todas las conversiones pueden ser Stream → Stream.
**Cómo puedo aplicar PDF/A?**Sitio PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(o 2u) antes de ahorrar.
**Puedo proteger las contraseñas de los PDFs?**Configure cifrado y banderas de permiso en PdfSaveOptions
.
**Es Markdown round-trip seguro?**Los diseños complejos pueden ser aproximados. tablas, listas, encabezados, enlaces y formatos en línea están apoyados con opciones tunables.
**Cómo puedo convertir páginas específicas?**Uso PageSet
En ImageSaveOptions
o FixedPageSaveOptions
‑Las clases derivadas.