Aspose.Words Document Converter pentru .NET
Aspose.Words Document Converter pentru .NET este o API ușoară, de înaltă performanță, care se concentrează pe format-to-format conversie. susține scenarii comune cum ar fi Word → PDF, HTML → pdf, DOCX ↔ ODT , DOCX → Markdown., PDF → imagini (JPG/PNG/TIFF) și zeci de altele – fără a necesita Microsoft Office.
Instalare și setare
- Instalarea pachetului NuGet
Aspose.Words
(Core API care conferă conversii). - Aplicați o licență măsurată la startup pentru a evita limitele de evaluare: vezi Licență măsurată .
- revizuirea cerinţelor de cadru în cadrul Ghid de instalare .
Platforme susținute
- Sistemul de operare: Windows, Linux, macOS
- Framework-uri: .NET 4.x, .Net Standard 2.0 , .net Core 2.0 – 3.1, .NET 5/6/7+, Mono
- IDE: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop
Începe rapid
1) Cuvânt → PDF (one-linear)
using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");
2) HTML → PDF cu opțiuni
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
Compliance = PdfCompliance.PdfA1b, // archival
EmbedFullFonts = false, // reduce size
OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);
Cuvânt cheie: DOCX Markdown
using Aspose.Words;
using Aspose.Words.Saving;
var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
TableContentAlignment = MarkdownTableContentAlignment.Auto,
ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);
4) PDF → imagini (pe pagină)
using Aspose.Words;
using Aspose.Words.Saving;
var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
img.PageSet = new PageSet(page);
pdfDoc.Save($"report_page_{page + 1}.png", img);
}
5) Stream → streaming (web/serviciu)
using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
var doc = new Aspose.Words.Document(input); // auto-detects format
doc.Save(output, SaveFormat.Pdf);
output.Position = 0;
return File(output.ToArray(), "application/pdf", "converted.pdf");
}
Caracteristici și funcționalitate
Capacitate în format larg
Introducere / ieșire (selectat):
- Familia Word: DOC, DOCX, DOT, RTF, WordML (XML)
- Layout fix: PDF, de la Etichetă: ePub/)
În cazul în care există atât un plugin **File Processor ** și acest Converter , puteți încărca/edita mai întâi și apoi exporta în formatul dorit.
Detectarea automată a formatului
API detectează format din titlurile de fișiere sau conținutul de flux , astfel încât să puteți accepta în siguranță încărcături arbitrare în serviciile web.
Fine-Tuning cu opțiuni de salvare
- PDF: PDF/A‐1b/2u, criptare, steaguri de permisiune, semnături digitale, încorporarea fontului, compresia imaginii.
- HTML/MHTML: gestionarea resurselor (embed vs. extern), modul CSS, codificarea, formatul imaginii și DPI.
- Imagini: DPI, adâncime de culoare, compresie, gamă de pagini, multi-pagini TIFF.
- Markdown: lista și stilurile de titlu, alinierea tabelului, generarea link-urilor.
Layout Fidelitate și Metadata
Conservă fontele, stilurile, tabelele, titlurile/footerii, marcajele de apă, comentariile, pauzele secțiunii și proprietățile documentului (autor, Titlu, câmpuri personalizate). Metadata poate fi transformată programat în timpul conversiei.
Procesare prietenoasă cu serverul
- Stream-first API, alocări scăzute, buffer I/O.
- Async/batch conversie și paralelizare pentru tranzit.
- Configurați limitele de memorie și de prelucrare a paginilor pentru docuri mari.
Diagnostică și rezistență
Excepții clare cu privire la intrările corupte / nesuportate; intrarea în logging / telemetry pentru a captura durate, număr de pagini și cauze de eșec SLA de urmărire.
Rețete populare de conversie
- **DOCX → PDF/XPS ** pentru distribuție și arhivare (opțional PDF/A).
- HTML → PDF pentru facturile, declarațiile și rapoartele cu pagină consistentă.
- DOCX ↔ ODT pentru interoperabilitatea cross-suite.
- DOCX → Markdown pentru a publica documente tehnice.
- PDF → PNG/JPEG/TIFF pentru a genera previziuni sau miniere.
- Word/HTML → EPUB pentru fluxurile de lucru e-book.
Sfat: Utilizați PageSet pentru a exporta pagini sau ranguri specifice; combinați cuImageSaveOptions pentru sprituri sau miniere.
Cele mai bune practici
- Licența întâi : inițializați licența măsurată înainte de orice conversii pentru a evita valorile de evaluare.
- Preferă fluxurile în servicii pentru a trece discul I/O și a reduce latența.
- Validați devreme : inspectați byte magice sau încercați o încărcare uscată pentru a eșua rapid.
- Size drepte: selectați DPI sensibil, evitați încorporarea oricărei fonturi dacă nu este necesar; alegeți PDF/A numai atunci când este nevoie de conformitate.
- Higiena resurselor : curățare
Document
şi fluxurile înusing
în blocuri. - Concurrență : utilizare pe termen scurt
Document
cazuri pe cerere; angajați piscine pentru opțiuni dacă este necesar. - Observabilitate : număr de pagini de jurnal, durate și seturi de opțiuni; etichetarea eșecurilor cu ID-urile de corelație.
FAQ
**Aveți nevoie de Microsoft Office?**Nu, este o API independentă.
**Pot să convertez fără a atinge sistemul de fișiere?**Toate conversiile pot fi Stream → Stream.
**Cum pot aplica PDF/A?**Setul PdfSaveOptions.Compliance = PdfCompliance.PdfA1b
(sau 2u) înainte de a economisi.
**Pot proteja pașapoartele PDF?**Da. Configurează steagurile de criptare și permisiuni în PdfSaveOptions
.
**Este Markdown round-trip sigur?**Tabelele, listele, titlurile, link-urile și formatarea inline sunt susținute cu opțiuni tunabile.
**Cum pot converti pagini specifice?**Utilizarea PageSet
în ImageSaveOptions
sau FixedPageSaveOptions
‑Clasele derivate.