Aspose.Words Конвертер документов для .NET

Aspose.Words Document Converter для .NET – это легкий, высокопроизводительный API, ориентированный на формат-на-формат-конвертирование. Он поддерживает общие сценарии, такие как Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown PDF → изображения (JPG/PNG/TIFF) и десятки других без требований Microsoft Office.

Инсталляция и установка

Поддерживаемые платформы

  • Операционная система: Windows, Linux, macOS
  • Фрамы: .NET Framework 4.x, .Net Standard 2.0, ,NET Core 2.0–3.1, .net 5/6/7+, Mono
  • ИДЕ: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Быстрый старт

1) Word → PDF (одна линия)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF с опциями

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Маркдаун

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → изображения (по странице)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Поток → поток (веб/сервис)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Особенности и функциональность

Широкий формат покрытия

Вход и выход (избранные):

  • Семья слов: DOC, DOCX, DOT, RTF, WordML (XML)
  • Фиксированное расположение: PDF, ОТТ Официальный формат / EPUB/)

Полная матрица согласовывается с возможностями Aspose.Words. Если присутствуют как **File Processor ** плагин, так и этот Converter , можно сначала загрузить/редактировать, а затем экспортировать в желаемом формате.

Автоматический формат обнаружения

API выявляет формат из **файловых заголовков ** или поток контента , поэтому вы можете безопасно принимать произвольные загрузки в веб-сервисах.

Fine-Tuning с Save Options

  • PDF: PDF/A‐1b/2u, шифрование, флаги разрешений, цифровые подписи, введение шрифта, компрессия изображения.
  • HTML/MHTML: Управление ресурсами (внутреннее против внешнего), режим CSS, кодирование, формат изображения и DPI.
  • Изображения: ДПИ, цветовая глубина, компрессия, диапазон страниц, многостраничный TIFF.
  • Markdown: списки и стили заголовка, табличная корректировка, генерация ссылок.

Описание Fidelity & Metadata

Сохранит шрифты, стили, таблицы, заголовки/ноги, водные знаки, комментарии, разрывы секции и документные свойства (автор, заголовок, персонализированные поля.

Серверно-привлекательная обработка

  • Stream-first APIs, низкие распределения, буферные I/O.
  • Async/batch конверсия и параллелизация для пропуска.
  • Конфигурируемая память и границы обработки страниц для больших дочек.

Диагностика и устойчивость

Ясные исключения по коррумпированным/неподдерживаемым входам; хок в логинг/телеметрию, чтобы зафиксировать продолжительность, количество страниц и причины неудачи СЛА Прослеживание.

Популярные конвертируемые рецепты

  • **DOCX → PDF/XPS ** для распределения и архивирования (опционально PDF/A).
  • HTML → PDF для фактов, заявлений и отчетов с последовательной страницей.
  • DOCX ↔ ODT для кроссоверной совместимости.
  • DOCX → Markdown для публикации технологических дочек.
  • PDF → PNG/JPEG/TIFF для создания предварительных просмотров или тоннелей.
  • Word/HTML → EPUB для рабочих потоков электронной книги.

Совет: Используйте **PageSet ** для экспорта конкретных страниц или диапазонов; комбинируйте с ImageSaveOptions на спирт или тоннели.

Лучшие практики

  • Лицензия первая : инициируйте мерную лицензию перед любыми конверсиями, чтобы избежать оценки водных знаков.
  • Преферируйте потоки в сервисах, чтобы пересечь I/O диска и уменьшить латентность.
  • Валидируйте рано : проверьте волшебные байты или попытайтесь быстро провалить сухой нагрузку.
  • **Правый размер выхода ** : выберите чувствительный ДПИ, избегайте включения любого шрифта, если не требуется; выбирайте PDF/A только при необходимости соблюдения.
  • Гигиена ресурсов : вверх Document и потоки в using В блоках.
  • Конкурентная валюта : краткосрочное использование Document Примеры по запросу; используйте бассейны для вариантов, если это необходимо.
  • Обсервативность : расчеты страниц журнала, продолжительности и наборы опций; ознакомление с ошибками с идентификаторами корреляции.

FAQ

**Нужны ли они Microsoft Office?**Нет, это самостоятельная API.

**Могу ли я конвертировать без прикосновения к файловой системе?**Все конверсии могут быть Stream → Stream.

**Как я исполняю PDF/A?**Сет PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (или 2у) до сохранения.

**Могу ли я защищать пароли PDF-файлов?**Да. Настройка шифрования и разрешения флагов в PdfSaveOptions.

**Безопасен ли Маркдаун круглый тур?**Таблицы, списки, заголовки, ссылки и форматирование в строке поддерживаются тонируемыми опциями.

**Как конвертировать конкретные страницы?**Использование PageSet В ImageSaveOptions или FixedPageSaveOptions‑дериватированных классов.

 Русский