Aspose.Words Convertidor de Documentos para .NET

Aspose.Words Document Converter para .NET es una API ligera y de alto rendimiento que se centra en la conversión de formato a formato.Suporta escenarios comunes como Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → imágenes (JPG/PNG/TIFF) y decenas de más – sin requerir Microsoft Office.

Instalación y configuración

  • Instalar el paquete NuGet Aspose.Words (Core API que potencia las conversiones).
  • Aplique una licencia medida en la startup para evitar límites de evaluación: ver Licenciamiento Medido .
  • Revisión de los requisitos de marco en el Guía de instalación .

Las plataformas apoyadas

  • Windows, Linux y MacOS
  • Frameworks: .NET Framework 4.x, .NET Standard 2.0, ,NET Core 2.0–3.1, .net 5/6/7+, Mono
  • IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Inicio rápido

1) Word → PDF (una línea)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF con opciones

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → imágenes (por página)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

El flujo de Internet (web / service)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Características y Funcionalidad

Cobertura en formato amplio

Entrada y salida (seleccionados):

  • Familia de palabras: DOC, DOCX, DOT, RTF, WordML (XML)
  • Layout fijo: PDF, OTT Página web / EPUB/)

La matriz completa se alinea con las capacidades de Aspose.Words.Si ambos están presentes un plugin de procesador de archivos y este convertidor, puede cargar/editar primero y luego exportar en el formato deseado.

Detección de formato automático

La API detecta el formato de los titulares de archivo o el contenido de corriente , por lo que puede aceptar de forma segura las cargas arbitrarias en los servicios web.

Fine-Tuning con Opciones de Salvación

  • PDF: PDF/A‐1b/2u, cifrado, banderas de permiso, firmas digitales, incorporación de fuentes, compresión de imágenes.
  • HTML/MHTML: manejo de recursos (embed vs. externo), modo CSS, codificación, formato de imagen y DPI.
  • Imajes: DPI, profundidad de color, compresión, rango de página, TIFF multi-página.
  • Markdown: listas y estilos de encabezamiento, alineación de mesa, generación de enlaces.

Fidelidad y Metadatos

Conserva fuentes, estilos, tablas, header/footers, marcadores de agua, comentarios, brechas de sección, y propiedades de documento (autor, título, campos personalizados.

Procesamiento amistoso con el servidor

  • APIs de flujo-primer , bajas alocaciones, bufferado I/O.
  • Async/batch conversión y paralelización para la transmisión.
  • Configurable memoria y límites de procesamiento de páginas para grandes doces.

Diagnóstico y resistencia

Excepciones claras sobre las entradas corrompidas/insueltas; logging/telemetry para capturar duraderas, cuentas de páginas y razones de fracaso SLA El rastreamiento.

Recetas de conversión popular

  • **DOCX → PDF/XPS ** para distribución y archivo (opcionalmente PDF/A).
  • HTML → PDF para las facturas, declaraciones y informes con una página consistente.
  • DOCX ↔ ODT para la interoperabilidad cross-suite.
  • DOCX → Markdown para publicar doces de tecnología.
  • PDF → PNG/JPEG/TIFF para generar previstas o miniaturas.
  • Word/HTML → EPUB para flujos de trabajo de e-book.

Consejo: Utilice **PageSet ** para exportar páginas o ramas específicas; combine con ImageSaveOptions en el caso de espritos o miniaturas.

Mejores Prácticas

  • License primero : inicia la licencia medida antes de cualquier conversión para evitar las puntuaciones de evaluación.
  • Preferir los flujos en los servicios para escapar del disco I/O y reducir la latencia.
  • Valida temprano : inspecciona los bajos mágicos o intenta una carga seca para fracasar rápidamente.
  • **Procedimiento de tamaño derecho ** : seleccione un DPI sensible, evite incorporar cada font si no es necesario; selecciona PDF/A sólo cuando se requiere el cumplimiento.
  • Higiene de los recursos : Wrap Document y los flujos en using Los bloques.
  • Concurrencia : uso a corto plazo Document instantes por solicitud; emplear piscinas para opciones si es necesario.
  • Observabilidad : números de página de registro, duraderas y conjuntos de opciones; etiquetando fallos con IDs de correlación.

FAQ

**Es necesario Microsoft Office?**No. Es un standalone API.

**Puedo convertir sin tocar el sistema de archivos?**Todas las conversiones pueden ser Stream → Stream.

**Cómo puedo aplicar PDF/A?**Sitio PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (o 2u) antes de ahorrar.

**Puedo proteger las contraseñas de los PDFs?**Configure cifrado y banderas de permiso en PdfSaveOptions.

**Es Markdown round-trip seguro?**Los diseños complejos pueden ser aproximados. tablas, listas, encabezados, enlaces y formatos en línea están apoyados con opciones tunables.

**Cómo puedo convertir páginas específicas?**Uso PageSet En ImageSaveOptions o FixedPageSaveOptions‑Las clases derivadas.

 Español