Aspose.Words tekstni procesor datoteke za .NET

Aspose.Words Text File Processor za .NET je API s laganom težinom usmjerenom na plain-text scenarije .txt, obavlja programske izmjene (upišite, izbrisajte, zamijenite) i save back to TXT s preciznom kontrolom nad kodiranje , BOM iline završetak – idealno za usluge, ETL radove i CI/CD cijevi.

Ne zahtijeva Microsoft Office. radi na Windows, Linuxu i macOS-u s .NET Frameworkom, .Net Core/5/6+, ili Mono.

Instaliranje i postavljanje

  • Instalirati Aspose.Words od NuGet.
  • Prijavite se za licencu na startu (vidjeti Metered Licensing ).
  • Pregled zahtjeva za sustav u [Installation Guide]https://docs.aspose.net/words/getting-started/installation/).

**Podržani scenariji: ** putovi datoteke i streams (preporučuje se za web/cloud).

Brzo početak

Stvaranje TXT datoteke (UTF‐8, CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Preuzmite TXT s izričito kodiranjem, dodajte tekst, sačuvajte kao LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Značajke i funkcionalnost

Stvaranje dokumenata

  • Počnite s bijelim tekstnim dokumentom u memoriji.
  • Sastavite **default kodiranje ** i EOL strategiju prilikom štednje.
  • Opcionalno napišite naslov / stop ** komentare** prije tjelesnog teksta.

Preuzimanje postojećeg TXT

  • Preuzmite iz path , stream ili byte[] skodiranjem auto-detektora ili prisilnim kodiranjima.
  • Održavanje ili normaliziranje linije prekida (CRLF / LF / CR) na opterećenju i / ili spašavanje.
  • Prijenos vrlo velikih datoteka kako bi se održala stabilna memorija.

Manipulacija teksta

  • Prebacite sadržaj putem poznatog modela Dokument → Odjeljak → Članak → Run.
  • Upišite, dodajte ili uklonite tekst na točnim mjestima – bez ručne matematike.
  • Izvođenje bulk pronaći / zamijeniti u cijelom dokumentu ili raspršene redove.
  • Razdvajanje / miješanje stavaka od strane prilagođenih delimitera.

Ušteda za TXT

  • Sačuvajte na datoteku ili stream ** s odabranim ** kodiranjem (UTF‐8/UTP‐16/ASCII/etc.).
  • Kontrola emisije **BOM ** i ParagraphBreak (EOL) izričito.
  • Prepisati ili pisati na ciljni tok koji upravljate.

Kodiranje & i18n

  • Potpuna podrška za Unicode.
  • Transparentni padovi za stranice nasljednog koda prilikom čitanja.
  • Otkrijte i sačuvajte Bomba na opterećenju, osim ako je prekomjerno.

Prethodni članakPrimjer API

  • Korištenje StreamStream za web usluge i funkcije u oblaku.
  • Jednostavno se integrira s S3/Blob SDK-ovima i in-memory cijevi.

Performance

  • Lean objekt model za ravni tekst.
  • Laze operacije smanjuju dodjele.
  • Thread-safe čitanje; sinhronizacija piše prilikom dijeljenja resursa.

Zajednički recepti

1) Regex Pronađite / zamijenite (kolapsa više prostora)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 do UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalizirajte linijske završetke (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Savjeti i najbolje prakse

  • Prefer stream-based API za velike datoteke i web aplikacije.
  • Uvijek postavite kodiranje na opterećenje i spašavanje kako biste izbjegli mojibake.
  • Batch uređuje u memoriji; save jednom kako bi se smanjila I/O.
  • Normalizirajte EOL na opterećenju, pretvorite se u ciljni Eol na štednju.
  • Koristite regex zamjenu za složenu čišćenje u jednom prolazu.
  • U dugotrajnim uslugama, provjerite mjerenu upotrebu i dobro se nosite s kvotama.

FAQ

**Hoće li TXT sačuvati tablice, slike ili stilove?**No. TXT je ravni tekst; napredna formatacija je pletenirana.

**Mogu li se priključiti postojećem datoteku bez prepisivanja?**Otvorite FileStream u dodatnom načinu i napišite sačuvani izlaz na njega.

**Kako odabrati završnu liniju?**Setovi TxtSaveOptions.ParagraphBreak na "\r\n" (Windows ili "\n" (Unix i MacOS).

**Kako isključiti UTF-8 BOM?**Korištenje new UTF8Encoding(false) u TxtSaveOptions.Encoding.

**Je li potrebna Office ili Notepad?**No. Aspose.Words je standalone.

 Hrvatski