Преобразувач документів Aspose.Words для .NET

Aspose.Words Document Converter для .NET є легким, високопродуктивним API, зосередженим на format-to-format конвертації. Він підтримує загальні сценарії, такі як Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown , PDF → зображення (JPG/PNG/TIFF) і десятки інших без необхідності Microsoft Office.

Інсталяція та установка

Підтримка платформ

  • Операційна система: Windows, Linux, MacOS
  • Фрагменти: .NET Framework 4.x, .net Standard 2.0, ,NET Core 2.0–3.1, .Net 5/6/7+, Mono
  • Ідеї: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Швидкий старт

1) Word → PDF (одна лінія)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF з варіантами

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOCX → Маркдаун

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → зображення (на сторінку)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Потік → потік (веб/сервіс)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Особливості та функціональність

Широкий формат покриття

Вхід / вихід (вибраний):

  • Сім’я слів: DOC, DOCX, DOT, RTF, WordML (XML)
  • Постійне розташування: PDF, ОТТ Створення / EPUB/)

Якщо як **File Processor ** плагін, так і цей Converter присутні, ви можете завантажити/редагувати спочатку, а потім експортувати в бажаному форматі.

Автоматичний формат виявлення

API виявляє формат з **файлових заголовків ** або потік контенту , так що ви можете безпечно прийняти произвольні завантаження в веб-сервісах.

Створення Fine-Tuning with Save Options

  • PDF: PDF/A-1b/2u, шифрування, ліцензійні прапори, цифрові підписи, вбудований шрифт, компресія зображення.
  • HTML/MHTML: обробка ресурсів (в межах проти зовнішнього), режим CSS, кодування, формат зображення та DPI.
  • Зображення: ДПІ, кольорова глибина, компресія, діапазон сторінки, багатосторонній TIFF.
  • Markdown: списки та заголовкові стилі, таблична збігання, генерація посилань.

Створення Layout Fidelity & Metadata

Зберігає шрифти, стилі, таблиці, заголовки / ноги, водяні знаки, коментарі, роздільні перерви, і документні властивості (автор, заголовок, пристосовані поля.

Серверно-дружній обробка

  • Стрим-перший АПІ, низькі виділення, буфер I/O.
  • Async/batch конвертація та паралелізація для проходження.
  • Налаштувані межі пам’яті та обробки сторінок для великих доків.

Діагностика та стійкість

Зрозумілі винятки щодо корумпованих/непідтримлених входів; хок в логінг/телеметрію для зйомок термінів, сторінки і причини невдачі СЛА Слідкувати.

Популярні конверсійні рецепти

  • **DOCX → PDF/XPS ** для розповсюдження та архівування (опціонально PDF/A).
  • HTML → PDF для фактів, заяв і звітів з постійною сторінкою.
  • DOCX ↔ ODT для міжсуїтної взаємодійності.
  • DOCX → Markdown для публікації технологічних доків.
  • PDF → PNG/JPEG/TIFF для створення переглядів або дрібнів.
  • Word/HTML → EPUB для робочих потоків електронної книги.

Довідка: Використовуйте **PageSet ** для експорту певних сторінок або рядків; поєднуйте з ImageSaveOptions на спирт або тоннелі.

Найкращі практики

  • Ліцензія перша : розпочати оцінювану ліцензію до будь-яких конверсій, щоб уникнути оцінки водних знаків.
  • Найкраще потоки в сервісах, щоб перервати диск I/O і зменшити затримку.
  • Відтверджуйте рано : перевірте чарівні байти або спробуйте суху навантаження швидко провалитися.
  • **Правий розмір виходу ** : виберіть чутливий DPI, не вставляйте будь-який шрифт, якщо цього не потрібно; вибирайте PDF/A тільки тоді, коли необхідна відповідність.
  • Ресурсна гігієна : обертання Document і потоки в using За блоками.
  • Конкурентоспроможність : короткочасне використання Document Приклади за запитом; використовувати басейни для варіантів, якщо це необхідно.
  • Постежність : обчислення сторінки журналу, тривалість і налаштування варіантів; ознака невдач з ідентифікаторами кореляції.

FAQ

**Чи потрібен Microsoft Office?**Не, це єдиний вогнепальний засіб.

**Чи можу я конвертувати без дотику до файлової системи?**Всі конверсії можуть бути Stream → Stream.

**Як я можу виконувати PDF/A?**Стіл PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (або 2у) перед тим, як заощадити.

**Чи можу я захищати паролі PDF?**Налаштуйте шифрування та ліцензійні знаки в PdfSaveOptions.

**Чи безпечно Маркдаун круглий поїзд?**Таблиці, списки, заголовки, посилання та форматування в лінії підтримуються тунельними варіантами.

**Як перетворити конкретні сторінки?**Користувати PageSet в ImageSaveOptions або FixedPageSaveOptions‑деривативі класи.

 Українська