Konwerter dokumentów Aspose.Words dla .NET
Aspose.Words Dokument Converter dla .NET to lekki, wysokiej wydajności API skoncentrowany na konwersji format-to-format. obsługuje powszechne scenariusze, takie jak Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown i PDF → obrazy (JPG/PNG/TIFF) oraz kilkadziesiąt innych – bez wymagania Microsoft Office.
Instalacja i ustawienie
- Instalacja pakietu NuGet
Aspose.Words
(Kierownicze API potwierdza konwersje). - Wniosek o licencję na start-up, aby uniknąć ograniczeń oceny: zobacz Licencjonowanie według zużycia .
- Przegląd wymogów ramowych w Instalacja przewodnik .
wspierane platformy
- System operacyjny: Windows, Linux, macOS
- Ramy: .NET Framework 4.x, .net Standard 2.0, ,NET Core 2.0–3.1, .Net 5/6/7+, Mono
- IDES: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Szybki start
1) Word → PDF (jedna linia)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF z opcjami
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → obrazy (na stronę)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Strumień → Stream (web / usługa)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Charakterystyka i funkcjonalność
Szeroki format pokrycia
Wprowadzenie / wyjście (wybrana):
- Rodzina słów: DOC, DOCX, DOT, RTF, WordML (XML)
- ustawione rozmiary: PDF, OTT Wtyczki / EPUB/)
Pełna matryca łączy się z funkcjami Aspose.Words.Jeśli istnieje zarówno plik **File Processor ** jak i ten Converter , można najpierw pobrać / edytować, a następnie eksportować w pożądanym formacie.
Automatyczna detekcja formatu
API wykrywa format z tytułów plików lub treści strumieniowych , dzięki czemu można bezpiecznie zaakceptować arbitralne przesyłki w usługach internetowych.
Fine-Tuning z opcjami przechowywania
- PDF: PDF/A‐1b/2u, szyfrowanie, flagi zezwoleń, podpisy cyfrowe, włączenie czcionek, kompresja obrazu.
- HTML/MHTML: zarządzanie zasobami (wzajemne vs. zewnętrzne), tryb CSS, kodowanie, format obrazu i DPI.
- Zdjęcia: DPI, głębokość koloru, kompresja, zakres stron, multi-page TIFF.
- Markdown: listy i styly tytułów, harmonizacja tabeli, generacja linków.
Layout lojalności i metadatu
Utrzymuje czcionki, style, tabele, nagłówki / stopy, znaky wody, komentarze, przerwy sekcji i właściwości dokumentów (autor, tytuł, pole dostosowane.
Serwer-przyjazny do przetwarzania
- Stream-first API, niskie przydziały, bufferowane I/O.
- Async/batch konwersja i równoległość do przepływu.
- Konfigurowane granice pamięci i przetwarzania stron dla dużych doków.
Diagnoza i odporność
Jasne wyjątki w odniesieniu do skorumpowanych/nieopieranych wpisów; przechowywanie w logowaniach/telemetrii, aby złapać okresy, liczby stron i przyczyny niepowodzenia SLA i śledzenia.
Popularne przepisy na konwersję
- **DOCX → PDF/XPS ** do dystrybucji i archiwizacji (opcjonalnie PDF/A).
- HTML → PDF dla faktur, oświadczeń i raportów z konsekwentną stroną.
- DOCX ↔ ODT dla interoperacyjności cross-suite.
- DOCX → Markdown do publikacji dokumentów technicznych.
- PDF → PNG/JPEG/TIFF do generowania wstępnych wyświetleń lub miniatur.
- Word/HTML → EPUB dla przepływów roboczych e-book.
Wskazówka: Użyj **PageSet ** do eksportu określonych stron lub rzęs; połączyć z ImageSaveOptions dla drutów lub miniatur.
Najlepsze praktyki
- Licencja pierwsza : inicjalizuj licencję mierzoną przed wszelkimi konwersjami, aby uniknąć oceny znaków wodnych.
- Preferuje strumienia w usługach, aby pominąć dysk I/O i zmniejszyć opóźnienie.
- Walidate early : sprawdź magiczne bajty lub spróbuj wysuszyć ładunek, aby szybko zniknąć.
- **Prawdziwy rozmiar wyjścia ** : wybierz wrażliwy DPI, unikać włączenia każdego czcionki, chyba że jest to wymagane; wybrać PDF/A tylko wtedy, gdy jest potrzebna zgodność.
- Hygiena zasobów : Wrap
Document
i strumieni wusing
z blokami. - Konkurencja : krótkotrwałe użytkowanie
Document
Przykłady na żądanie; zatrudnienie basenów dla opcji w razie potrzeby. - Obserwowalność : liczby stron dziennika, okresy i zestawy opcji; oznaczanie niepowodzeń z identyfikatorami korelacji.
FAQ
**Czy wymaga to Microsoft Office?**Nie, jest to niezależna API.
**Czy mogę konwertować bez dotyku systemu plików?**Wszystkie konwersje mogą być Stream → Stream.
**Jak mogę wdrożyć PDF/A?**zestaw PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(lub 2u) przed oszczędzaniem.
**Czy mogę zabezpieczyć pliki PDF?**Tak. Konfiguracja szyfrowania i zezwolenia flagi w PdfSaveOptions
.
**Czy Markdown round-trip jest bezpieczny?**Tabele, listy, nagłówki, linki i formatowanie inline są obsługiwane opcjami tunable.
**Jak konwertować konkretne strony?**Używanie PageSet
w ImageSaveOptions
lub FixedPageSaveOptions
‑i klas pochodnych.