Konwerter dokumentów Aspose.Words dla .NET

Aspose.Words Dokument Converter dla .NET to lekki, wysokiej wydajności API skoncentrowany na konwersji format-to-format. obsługuje powszechne scenariusze, takie jak Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown i PDF → obrazy (JPG/PNG/TIFF) oraz kilkadziesiąt innych – bez wymagania Microsoft Office.

Instalacja i ustawienie

wspierane platformy

  • System operacyjny: Windows, Linux, macOS
  • Ramy: .NET Framework 4.x, .net Standard 2.0, ,NET Core 2.0–3.1, .Net 5/6/7+, Mono
  • IDES: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Szybki start

1) Word → PDF (jedna linia)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF z opcjami

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → obrazy (na stronę)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Strumień → Stream (web / usługa)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Charakterystyka i funkcjonalność

Szeroki format pokrycia

Wprowadzenie / wyjście (wybrana):

  • Rodzina słów: DOC, DOCX, DOT, RTF, WordML (XML)
  • ustawione rozmiary: PDF, OTT Wtyczki / EPUB/)

Pełna matryca łączy się z funkcjami Aspose.Words.Jeśli istnieje zarówno plik **File Processor ** jak i ten Converter , można najpierw pobrać / edytować, a następnie eksportować w pożądanym formacie.

Automatyczna detekcja formatu

API wykrywa format z tytułów plików lub treści strumieniowych , dzięki czemu można bezpiecznie zaakceptować arbitralne przesyłki w usługach internetowych.

Fine-Tuning z opcjami przechowywania

  • PDF: PDF/A‐1b/2u, szyfrowanie, flagi zezwoleń, podpisy cyfrowe, włączenie czcionek, kompresja obrazu.
  • HTML/MHTML: zarządzanie zasobami (wzajemne vs. zewnętrzne), tryb CSS, kodowanie, format obrazu i DPI.
  • Zdjęcia: DPI, głębokość koloru, kompresja, zakres stron, multi-page TIFF.
  • Markdown: listy i styly tytułów, harmonizacja tabeli, generacja linków.

Layout lojalności i metadatu

Utrzymuje czcionki, style, tabele, nagłówki / stopy, znaky wody, komentarze, przerwy sekcji i właściwości dokumentów (autor, tytuł, pole dostosowane.

Serwer-przyjazny do przetwarzania

  • Stream-first API, niskie przydziały, bufferowane I/O.
  • Async/batch konwersja i równoległość do przepływu.
  • Konfigurowane granice pamięci i przetwarzania stron dla dużych doków.

Diagnoza i odporność

Jasne wyjątki w odniesieniu do skorumpowanych/nieopieranych wpisów; przechowywanie w logowaniach/telemetrii, aby złapać okresy, liczby stron i przyczyny niepowodzenia SLA i śledzenia.

Popularne przepisy na konwersję

  • **DOCX → PDF/XPS ** do dystrybucji i archiwizacji (opcjonalnie PDF/A).
  • HTML → PDF dla faktur, oświadczeń i raportów z konsekwentną stroną.
  • DOCX ↔ ODT dla interoperacyjności cross-suite.
  • DOCX → Markdown do publikacji dokumentów technicznych.
  • PDF → PNG/JPEG/TIFF do generowania wstępnych wyświetleń lub miniatur.
  • Word/HTML → EPUB dla przepływów roboczych e-book.

Wskazówka: Użyj **PageSet ** do eksportu określonych stron lub rzęs; połączyć z ImageSaveOptions dla drutów lub miniatur.

Najlepsze praktyki

  • Licencja pierwsza : inicjalizuj licencję mierzoną przed wszelkimi konwersjami, aby uniknąć oceny znaków wodnych.
  • Preferuje strumienia w usługach, aby pominąć dysk I/O i zmniejszyć opóźnienie.
  • Walidate early : sprawdź magiczne bajty lub spróbuj wysuszyć ładunek, aby szybko zniknąć.
  • **Prawdziwy rozmiar wyjścia ** : wybierz wrażliwy DPI, unikać włączenia każdego czcionki, chyba że jest to wymagane; wybrać PDF/A tylko wtedy, gdy jest potrzebna zgodność.
  • Hygiena zasobów : Wrap Document i strumieni w using z blokami.
  • Konkurencja : krótkotrwałe użytkowanie Document Przykłady na żądanie; zatrudnienie basenów dla opcji w razie potrzeby.
  • Obserwowalność : liczby stron dziennika, okresy i zestawy opcji; oznaczanie niepowodzeń z identyfikatorami korelacji.

FAQ

**Czy wymaga to Microsoft Office?**Nie, jest to niezależna API.

**Czy mogę konwertować bez dotyku systemu plików?**Wszystkie konwersje mogą być Stream → Stream.

**Jak mogę wdrożyć PDF/A?**zestaw PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (lub 2u) przed oszczędzaniem.

**Czy mogę zabezpieczyć pliki PDF?**Tak. Konfiguracja szyfrowania i zezwolenia flagi w PdfSaveOptions.

**Czy Markdown round-trip jest bezpieczny?**Tabele, listy, nagłówki, linki i formatowanie inline są obsługiwane opcjami tunable.

**Jak konwertować konkretne strony?**Używanie PageSet w ImageSaveOptions lub FixedPageSaveOptions‑i klas pochodnych.

 Polski