Aspose.Words Document Converter za .NET

Aspose.Words Dokument Converter za .NET je lagana, visoke učinkovitosti API usmjerena na format-to-format konverzije. Podržava uobičajene scenarije kao što su Word → PDF, HTML → pdf**, DOCX ↔ ODT* , * DOCX → Markdown** i PDF → slike (JPG/PNG/TIFF) te desetak više – bez zahtjeva za Microsoft Office.

Instaliranje i postavljanje

  • Instaliranje paketa NuGet Aspose.Words (Core API omogućuje konverzije).
  • Zatražite mjerenu licenciju na startup-u kako biste izbjegli granice ocjenjivanja: pogledajte Mjerena dozvola .
  • Pregled okvirnih zahtjeva u Priručnik za instalaciju .

Podržana platforma

  • Operacijski sustav: Windows, Linux, MacOS
  • Okvirni radovi: .NET Framework 4.x, .NET Standard 2.0, NET Core 2.0–3.1, .NET 5/6/7+, Mono
  • Ide: Visual Studio 2017–2022, JetBrains Rider, MonoDevelop

Brzo početak

1) Word → PDF (jedna linija)

using Aspose.Words;
var doc = new Document("input.docx");
doc.Save("output.pdf");

2) HTML → PDF s opcijama

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("input.html");
var pdf = new PdfSaveOptions
{
    Compliance = PdfCompliance.PdfA1b,    // archival
    EmbedFullFonts = false,               // reduce size
    OptimizationOptions = { ImageCompression = PdfImageCompression.Jpeg }
};
doc.Save("output.pdf", pdf);

3) DOKX → Markdown

using Aspose.Words;
using Aspose.Words.Saving;

var doc = new Document("spec.docx");
var md = new MarkdownSaveOptions
{
    TableContentAlignment = MarkdownTableContentAlignment.Auto,
    ListExportMode = MarkdownListExportMode.PlainText
};
doc.Save("spec.md", md);

4) PDF → slike (po stranici)

using Aspose.Words;
using Aspose.Words.Saving;

var pdfDoc = new Document("report.pdf");
var img = new ImageSaveOptions(SaveFormat.Png) { Resolution = 200 };
for (int page = 0; page < pdfDoc.PageCount; page++)
{
    img.PageSet = new PageSet(page);
    pdfDoc.Save($"report_page_{page + 1}.png", img);
}

5) Stream → stream (web/služba)

using (var input = httpFile.OpenReadStream())
using (var output = new MemoryStream())
{
    var doc = new Aspose.Words.Document(input);   // auto-detects format
    doc.Save(output, SaveFormat.Pdf);
    output.Position = 0;
    return File(output.ToArray(), "application/pdf", "converted.pdf");
}

Značajke i funkcionalnost

Široko formirano pokrivanje

Uvoz / izlazak (izabrani):

  • Familja riječi: DOC, DOCX, DOT, RTF, WordML (XML)
  • Fiksni raspored: PDF, OTT Obrazac / EPUB/)

Ako su prisutni i **File Processor ** plugin i ovaj Converter , možete najprije preuzeti / urediti, a zatim izvoziti u željeni format.

Automatsko otkrivanje formata

API otkrije format iz naslovnika datoteke ili sadržaja u toku , tako da možete sigurno prihvatiti arbitrarne preuzimanja u web uslugama.

Fine-Tuning s opcijama za spašavanje

  • PDF: PDF/A‐1b/2u, šifriranje, zastave odobrenja, digitalni potpis, ugradnja fontova, kompresija slike.
  • HTML/MHTML: upravljanje resursima (izvan protiv vanjskog), CSS način, kodiranje, format slike i DPI.
  • Slika: DPI, boja dubina, kompresija, raspon stranica, multi-page TIFF.
  • Markdown: popis i naslovni stilovi, usklađivanje tablice, generacija poveznica.

Slijedeći članakFidelity & Metadata

Održavaju pisma, stilove, tablice, naslovnice/strijelce, vodene oznake, komentare, odjeljke i dokumentne svojstva (autor, naslova, prilagođene polja.

Službeno-prijateljsko obradu

  • Stream-first API, niske dodjele, buffered I/O.
  • Async/batch konverzija i paralelizacija za prijelaz.
  • Konfigurirani ograničenja za obradu memorije i stranice za velike dokove.

dijagnoza i otpornost

Jasne iznimke o korumpiranim/nepodržanim ulazima; upućivanje u logging/telemetriju kako bi se uhvatile dužine, brojke stranica i razlozi za neuspjeh SLA i tracking.

Popularni recepti za konverziju

  • **DOCX → PDF/XPS ** za distribuciju i arhiviranje (opcionalno PDF/A).
  • HTML → PDF za račune, izjave i izvješća s dosljednom stranicom.
  • DOCX ↔ ODT za interoperabilnost cross-suite.
  • DOCX → Markdown za objavljivanje tehničkih dokaza.
  • PDF → PNG/JPEG/TIFF za stvaranje predviđanja ili miniature.
  • Word/HTML → EPUB za e-knjige radnih tokova.

Savjet: Koristite **PageSet ** kako biste izvozili određene stranice ili redove; kombinirajte s ImageSaveOptions za napitke ili miniature.

Najbolje prakse

  • License first : inicijalizirajte mjerenu licenciju prije bilo kakvih konverzija kako bi se izbjegle ocjenjive vodene oznake.
  • Preferirate struje u uslugama kako biste prekinuli I/O diska i smanjili latenciju.
  • Validacija ranije : provjerite magične bajte ili pokušajte suho opterećenje da brzo propadne.
  • **Right-size output ** : odaberite osjetljivu DPI, izbjegavajte ugradnju svakog pisma ako to nije potrebno; odaberi PDF/A samo kada je potrebna usklađenost.
  • Higijena resursa : Wrap Document i struje u using u blokovima.
  • Konkurencija : kratkotrajna uporaba Document primjeri po zahtjevu; zapošljavanje bazena za opcije, ako je potrebno.
  • Observabilnost : brojevi log stranice, trajanja i opcije; označavanje neuspjeha s korelacijskim ID-ovima.

FAQ

**Hoće li to biti Microsoft Office?**Ne, to je samostalna API.

**Mogu li konvertirati bez dodirivanja sustava datoteke?**Sve konverzije mogu biti Stream → Stream.

**Kako mogu izvršiti PDF/A?**Setovi PdfSaveOptions.Compliance = PdfCompliance.PdfA1b (ili 2u) prije uštede.

**Mogu li zaštititi lozinku od PDF-a?**Da. Konfigurirajte šifriranje i dozvole zastave u PdfSaveOptions.

**Je li Markdown okrugli put siguran?**Tablice, popisi, naslovnici, poveznice i inline formatacije podržavaju se tunabilnim opcijama.

**Kako mogu pretvoriti određene stranice?**Korištenje PageSet u ImageSaveOptions ili FixedPageSaveOptions‑izvedenih razreda.

 Hrvatski