Aspose.Words Конвертер документов для .NET
Aspose.Words Document Converter для .NET – это легкий, высокопроизводительный API, ориентированный на формат-на-формат-конвертирование. Он поддерживает общие сценарии, такие как Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown PDF → изображения (JPG/PNG/TIFF) и десятки других без требований Microsoft Office.
Инсталляция и установка
- Настройка пакета NuGet
Aspose.Words
(Основная API способствует конверсиям). - Применить мерную лицензию на стартапе, чтобы избежать границ оценки: см Лицензирование с учетом объема потребления .
- Рецензия на рамковые требования в Инсталляционный водитель .
Поддерживаемые платформы
- Операционная система: Windows, Linux, macOS
- Фрамы: .NET Framework 4.x, .Net Standard 2.0, ,NET Core 2.0–3.1, .net 5/6/7+, Mono
- ИДЕ: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Быстрый старт
1) Word → PDF (одна линия)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF с опциями
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
3) DOCX → Маркдаун
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → изображения (по странице)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Поток → поток (веб/сервис)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Особенности и функциональность
Широкий формат покрытия
Вход и выход (избранные):
- Семья слов: DOC, DOCX, DOT, RTF, WordML (XML)
- Фиксированное расположение: PDF, ОТТ Официальный формат / EPUB/)
Полная матрица согласовывается с возможностями Aspose.Words. Если присутствуют как **File Processor ** плагин, так и этот Converter , можно сначала загрузить/редактировать, а затем экспортировать в желаемом формате.
Автоматический формат обнаружения
API выявляет формат из **файловых заголовков ** или поток контента , поэтому вы можете безопасно принимать произвольные загрузки в веб-сервисах.
Fine-Tuning с Save Options
- PDF: PDF/A‐1b/2u, шифрование, флаги разрешений, цифровые подписи, введение шрифта, компрессия изображения.
- HTML/MHTML: Управление ресурсами (внутреннее против внешнего), режим CSS, кодирование, формат изображения и DPI.
- Изображения: ДПИ, цветовая глубина, компрессия, диапазон страниц, многостраничный TIFF.
- Markdown: списки и стили заголовка, табличная корректировка, генерация ссылок.
Описание Fidelity & Metadata
Сохранит шрифты, стили, таблицы, заголовки/ноги, водные знаки, комментарии, разрывы секции и документные свойства (автор, заголовок, персонализированные поля.
Серверно-привлекательная обработка
- Stream-first APIs, низкие распределения, буферные I/O.
- Async/batch конверсия и параллелизация для пропуска.
- Конфигурируемая память и границы обработки страниц для больших дочек.
Диагностика и устойчивость
Ясные исключения по коррумпированным/неподдерживаемым входам; хок в логинг/телеметрию, чтобы зафиксировать продолжительность, количество страниц и причины неудачи СЛА Прослеживание.
Популярные конвертируемые рецепты
- **DOCX → PDF/XPS ** для распределения и архивирования (опционально PDF/A).
- HTML → PDF для фактов, заявлений и отчетов с последовательной страницей.
- DOCX ↔ ODT для кроссоверной совместимости.
- DOCX → Markdown для публикации технологических дочек.
- PDF → PNG/JPEG/TIFF для создания предварительных просмотров или тоннелей.
- Word/HTML → EPUB для рабочих потоков электронной книги.
Совет: Используйте **PageSet ** для экспорта конкретных страниц или диапазонов; комбинируйте с ImageSaveOptions на спирт или тоннели.
Лучшие практики
- Лицензия первая : инициируйте мерную лицензию перед любыми конверсиями, чтобы избежать оценки водных знаков.
- Преферируйте потоки в сервисах, чтобы пересечь I/O диска и уменьшить латентность.
- Валидируйте рано : проверьте волшебные байты или попытайтесь быстро провалить сухой нагрузку.
- **Правый размер выхода ** : выберите чувствительный ДПИ, избегайте включения любого шрифта, если не требуется; выбирайте PDF/A только при необходимости соблюдения.
- Гигиена ресурсов : вверх
Document
и потоки вusing
В блоках. - Конкурентная валюта : краткосрочное использование
Document
Примеры по запросу; используйте бассейны для вариантов, если это необходимо. - Обсервативность : расчеты страниц журнала, продолжительности и наборы опций; ознакомление с ошибками с идентификаторами корреляции.
FAQ
**Нужны ли они Microsoft Office?**Нет, это самостоятельная API.
**Могу ли я конвертировать без прикосновения к файловой системе?**Все конверсии могут быть Stream → Stream.
**Как я исполняю PDF/A?**Сет PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(или 2у) до сохранения.
**Могу ли я защищать пароли PDF-файлов?**Да. Настройка шифрования и разрешения флагов в PdfSaveOptions
.
**Безопасен ли Маркдаун круглый тур?**Таблицы, списки, заголовки, ссылки и форматирование в строке поддерживаются тонируемыми опциями.
**Как конвертировать конкретные страницы?**Использование PageSet
В ImageSaveOptions
или FixedPageSaveOptions
‑дериватированных классов.