Aspose.Words Dokumenten-Konverter für .NET
Aspose.Words Document Converter für .NET ist eine leichte, hochleistungsfähige API, die sich auf format-to-format konvertierung konzentriert. Es unterstützt allgemeine Szenarien wie Word → PDF, HTML → pdf , DOCX ↔ ODT, DOCX → Markdown., PDF → Bilder (JPG/PNG/TIFF) und Dutzende mehr – ohne Microsoft Office erforderlich.
Installation und Setup
- Installieren Sie das NuGet-Paket
Aspose.Words
(Core API macht Konvertierungen). - Anwenden Sie eine gemessene Lizenz bei Startups, um Einschätzungsgrenze zu vermeiden: siehe Metered Licensing .
- Prüfung der Rahmenanforderungen in der Installationsguide .
unterstützte Plattformen
- OS: Windows, Linux und macOS
- Frameworks: .NET Framework 4.x, .NET Standard 2.0,.NET Core 2.0–3.1, .net 5/6/7+, Mono
- IDEs: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Schneller Start
1) Word → PDF (eine Linie)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF mit Optionen
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → Bilder (per Seite)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
Strömung → Stream (Web/Service)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Eigenschaften und Funktionalität
Breitformat Coverage
Eintritt / Ausgang (ausgewählt):
- Word-Familie: DOC, DOCX, DOT, RTF, WordML (XML)
- Fixed Layout: PDF, aus Veröffentlichungen / ePub/)
Wenn sowohl ein **File Processor ** Plugin als auch dieses Converter vorhanden sind, können Sie zunächst Laden/Bearbeiten und dann im gewünschten Format exportieren.
Automatische Format-Detektion
Die API erkennt Format aus **File-Header ** oder Stream-Inhalte , so dass Sie freiwillige Laden in Web-Diensten sicher akzeptieren können.
Fine-Tuning mit Save Options
- PDF: PDF/A‐1b/2u, Verschlüsselung, Genehmigungsvlaggen, digitale Unterschriften, Schriftgabe, Bildkompression.
- HTML/MHTML: Ressourcenbehandlung (embed vs. extern), CSS-Modus, Codierung, Bildformat & DPI.
- Bilder: DPI, Farbtiefe, Kompression, Seitenbereich, Multi-Page TIFF.
- Markdown: Liste und Titelstile, Tabelleanpassung, Linkgeneration.
Layout Fidelity & Metadaten
Er bewahrt Fonts, Styles, Tabellen, Header/Footers, Wassermarken, Kommentare, Abschnittbrechen und Dokument Eigenschaften (Autor, Titel, benutzerdefinierte Felder). Metadaten können während der Konvertierung programmatisch verwandelt werden.
Serverfreundliche Verarbeitung
- Stream-first APIs, niedrige Zuschüsse, buffert I/O.
- Async/batch Konvertierung und Parallelierung für den Durchgang.
- Konfigurierbare Speicher- und Seitenverarbeitungsgrenze für große Docs.
Diagnose und Resilienz
Klarer Ausnahmen für korrupte/ununterstützte Einträge; Hock in Logging/Telemetry, um Dauer, Seitenzahlen und Fehlergründe zu erfassen SLA und Tracking.
Popular Conversion Rezepte
- **DOCX → PDF/XPS ** für Vertrieb und Archivierung (optionell PDF/A).
- HTML → PDF für Rechnungen, Erklärungen und Berichte mit konsistenter Seite.
- DOCX ↔ ODT für Cross-Suite-Interoperabilität.
- DOCX → Markdown zur Veröffentlichung von Tech Docs.
- PDF → PNG/JPEG/TIFF zur Erzeugung von Vorgaben oder Miniaten.
- Word/HTML → EPUB für E-Book Workflows.
Tipp: Verwenden Sie **PageSet ** , um bestimmte Seiten oder Reihen zu exportieren; kombinieren Sie mit ImageSaveOptions für Sprites oder Thumbnails.
Beste Praktiken
- License first : Initialisieren Sie messende Lizenzen vor jeder Umwandlung, um Bewertungswassermarken zu vermeiden.
- Preferieren Sie Streams in Dienstleistungen, um den Disk I/O zu überwinden und Lateenz zu reduzieren.
- Schon validieren : Überprüfen Sie magische Byte oder versuchen Sie, eine trockene Ladung schnell zu fehlen.
- **Right-Size Output ** : Wählen Sie empfindliche DPI aus, vermeiden Sie, jede Schrift zu integrieren, es sei denn, erforderlich; wählen sie PDF/A nur, wenn die Einhaltung notwendig ist.
- Ressourcenhygiene : Wrap
Document
und Streams inusing
und Blöcke. - Konkurrenz : kurzlebige Verwendung
Document
Beispiele nach Anfrage; Anwenden von Pool für Optionen, wenn nötig. - Beobachtbarkeit : Log-Seitenzahlen, Dauer und Optionssätze; Kennzeichnung Fehler mit Korrelations-IDs.
FAQ
**Barf es Microsoft Office?**Nein, es ist eine standalone API.
**Kann ich konvertieren, ohne das Dateisystem zu berühren?**Ja. Alle Konvertierungen können Stream → Stream sein.
**Wie kann ich PDF/A anwenden?**Set PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(oder 2u) vor dem Sparen.
**Kann ich PDFs mit Passwort schützen?**Ja. Konfigurieren Sie Verschlüsselung und Erlaubnis-Flaggen in PdfSaveOptions
.
**Ist Markdown Rund-Trip sicher?**Tabellen, Listen, Header, Links und Inline-Formatierung werden mit tunbaren Optionen unterstützt.
**Wie kann ich bestimmte Seiten konvertieren?**Use PageSet
in ImageSaveOptions
oder FixedPageSaveOptions
‑der abgeleiteten Klassen.