Aspose.Words Dokumenten-Konverter für .NET

Aspose.Words Document Converter für .NET ist eine leichte, hochleistungsfähige API, die sich auf format-to-format konvertierung konzentriert. Es unterstützt allgemeine Szenarien wie Word → PDF, HTML → pdf , DOCX ↔ ODT, DOCX → Markdown., PDF → Bilder (JPG/PNG/TIFF) und Dutzende mehr – ohne Microsoft Office erforderlich.

Installation und Setup

  • Installieren Sie das NuGet-Paket Aspose.Words (Core API macht Konvertierungen).
  • Anwenden Sie eine gemessene Lizenz bei Startups, um Einschätzungsgrenze zu vermeiden: siehe Metered Licensing .
  • Prüfung der Rahmenanforderungen in der Installationsguide .

unterstützte Plattformen

  • OS: Windows, Linux und macOS
  • Frameworks: .NET Framework 4.x, .NET Standard 2.0,.NET Core 2.0–3.1, .net 5/6/7+, Mono
  • IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Schneller Start

1) Word → PDF (eine Linie)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF mit Optionen

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → Bilder (per Seite)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

Strömung → Stream (Web/Service)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Eigenschaften und Funktionalität

Breitformat Coverage

Eintritt / Ausgang (ausgewählt):

  • Word-Familie: DOC, DOCX, DOT, RTF, WordML (XML)
  • Fixed Layout: PDF, aus Veröffentlichungen / ePub/)

Wenn sowohl ein **File Processor ** Plugin als auch dieses Converter vorhanden sind, können Sie zunächst Laden/Bearbeiten und dann im gewünschten Format exportieren.

Automatische Format-Detektion

Die API erkennt Format aus **File-Header ** oder Stream-Inhalte , so dass Sie freiwillige Laden in Web-Diensten sicher akzeptieren können.

Fine-Tuning mit Save Options

  • PDF: PDF/A‐1b/2u, Verschlüsselung, Genehmigungsvlaggen, digitale Unterschriften, Schriftgabe, Bildkompression.
  • HTML/MHTML: Ressourcenbehandlung (embed vs. extern), CSS-Modus, Codierung, Bildformat & DPI.
  • Bilder: DPI, Farbtiefe, Kompression, Seitenbereich, Multi-Page TIFF.
  • Markdown: Liste und Titelstile, Tabelleanpassung, Linkgeneration.

Layout Fidelity & Metadaten

Er bewahrt Fonts, Styles, Tabellen, Header/Footers, Wassermarken, Kommentare, Abschnittbrechen und Dokument Eigenschaften (Autor, Titel, benutzerdefinierte Felder). Metadaten können während der Konvertierung programmatisch verwandelt werden.

Serverfreundliche Verarbeitung

  • Stream-first APIs, niedrige Zuschüsse, buffert I/O.
  • Async/batch Konvertierung und Parallelierung für den Durchgang.
  • Konfigurierbare Speicher- und Seitenverarbeitungsgrenze für große Docs.

Diagnose und Resilienz

Klarer Ausnahmen für korrupte/ununterstützte Einträge; Hock in Logging/Telemetry, um Dauer, Seitenzahlen und Fehlergründe zu erfassen SLA und Tracking.

Popular Conversion Rezepte

  • **DOCX → PDF/XPS ** für Vertrieb und Archivierung (optionell PDF/A).
  • HTML → PDF für Rechnungen, Erklärungen und Berichte mit konsistenter Seite.
  • DOCX ↔ ODT für Cross-Suite-Interoperabilität.
  • DOCX → Markdown zur Veröffentlichung von Tech Docs.
  • PDF → PNG/JPEG/TIFF zur Erzeugung von Vorgaben oder Miniaten.
  • Word/HTML → EPUB für E-Book Workflows.

Tipp: Verwenden Sie **PageSet ** , um bestimmte Seiten oder Reihen zu exportieren; kombinieren Sie mit ImageSaveOptions für Sprites oder Thumbnails.

Beste Praktiken

  • License first : Initialisieren Sie messende Lizenzen vor jeder Umwandlung, um Bewertungswassermarken zu vermeiden.
  • Preferieren Sie Streams in Dienstleistungen, um den Disk I/O zu überwinden und Lateenz zu reduzieren.
  • Schon validieren : Überprüfen Sie magische Byte oder versuchen Sie, eine trockene Ladung schnell zu fehlen.
  • **Right-Size Output ** : Wählen Sie empfindliche DPI aus, vermeiden Sie, jede Schrift zu integrieren, es sei denn, erforderlich; wählen sie PDF/A nur, wenn die Einhaltung notwendig ist.
  • Ressourcenhygiene : Wrap Document und Streams in using und Blöcke.
  • Konkurrenz : kurzlebige Verwendung Document Beispiele nach Anfrage; Anwenden von Pool für Optionen, wenn nötig.
  • Beobachtbarkeit : Log-Seitenzahlen, Dauer und Optionssätze; Kennzeichnung Fehler mit Korrelations-IDs.

FAQ

**Barf es Microsoft Office?**Nein, es ist eine standalone API.

**Kann ich konvertieren, ohne das Dateisystem zu berühren?**Ja. Alle Konvertierungen können Stream → Stream sein.

**Wie kann ich PDF/A anwenden?**Set PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (oder 2u) vor dem Sparen.

**Kann ich PDFs mit Passwort schützen?**Ja. Konfigurieren Sie Verschlüsselung und Erlaubnis-Flaggen in PdfSaveOptions.

**Ist Markdown Rund-Trip sicher?**Tabellen, Listen, Header, Links und Inline-Formatierung werden mit tunbaren Optionen unterstützt.

**Wie kann ich bestimmte Seiten konvertieren?**Use PageSet in ImageSaveOptions oder FixedPageSaveOptions‑der abgeleiteten Klassen.

 Deutsch