Aspose.Words tekstni procesor datoteke za .NET
Aspose.Words Text File Processor za .NET je API s laganom težinom usmjerenom na plain-text scenarije .txt
, obavlja programske izmjene (upišite, izbrisajte, zamijenite) i save back to TXT s preciznom kontrolom nad kodiranje , BOM iline završetak – idealno za usluge, ETL radove i CI/CD cijevi.
Ne zahtijeva Microsoft Office. radi na Windows, Linuxu i macOS-u s .NET Frameworkom, .Net Core/5/6+, ili Mono.
Instaliranje i postavljanje
- Instalirati Aspose.Words od NuGet.
- Prijavite se za licencu na startu (vidjeti Metered Licensing ).
- Pregled zahtjeva za sustav u [Installation Guide]https://docs.aspose.net/words/getting-started/installation/).
**Podržani scenariji: ** putovi datoteke i streams (preporučuje se za web/cloud).
Brzo početak
Stvaranje TXT datoteke (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Preuzmite TXT s izričito kodiranjem, dodajte tekst, sačuvajte kao LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Značajke i funkcionalnost
Stvaranje dokumenata
- Počnite s bijelim tekstnim dokumentom u memoriji.
- Sastavite **default kodiranje ** i EOL strategiju prilikom štednje.
- Opcionalno napišite naslov / stop ** komentare** prije tjelesnog teksta.
Preuzimanje postojećeg TXT
- Preuzmite iz path , stream ili byte[] skodiranjem auto-detektora ili prisilnim kodiranjima.
- Održavanje ili normaliziranje linije prekida (CRLF / LF / CR) na opterećenju i / ili spašavanje.
- Prijenos vrlo velikih datoteka kako bi se održala stabilna memorija.
Manipulacija teksta
- Prebacite sadržaj putem poznatog modela Dokument → Odjeljak → Članak → Run.
- Upišite, dodajte ili uklonite tekst na točnim mjestima – bez ručne matematike.
- Izvođenje bulk pronaći / zamijeniti u cijelom dokumentu ili raspršene redove.
- Razdvajanje / miješanje stavaka od strane prilagođenih delimitera.
Ušteda za TXT
- Sačuvajte na datoteku ili stream ** s odabranim ** kodiranjem (UTF‐8/UTP‐16/ASCII/etc.).
- Kontrola emisije **BOM ** i ParagraphBreak (EOL) izričito.
- Prepisati ili pisati na ciljni tok koji upravljate.
Kodiranje & i18n
- Potpuna podrška za Unicode.
- Transparentni padovi za stranice nasljednog koda prilikom čitanja.
- Otkrijte i sačuvajte Bomba na opterećenju, osim ako je prekomjerno.
Prethodni članakPrimjer API
- Korištenje
Stream
→Stream
za web usluge i funkcije u oblaku. - Jednostavno se integrira s S3/Blob SDK-ovima i in-memory cijevi.
Performance
- Lean objekt model za ravni tekst.
- Laze operacije smanjuju dodjele.
- Thread-safe čitanje; sinhronizacija piše prilikom dijeljenja resursa.
Zajednički recepti
1) Regex Pronađite / zamijenite (kolapsa više prostora)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 do UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalizirajte linijske završetke (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Savjeti i najbolje prakse
- Prefer stream-based API za velike datoteke i web aplikacije.
- Uvijek postavite kodiranje na opterećenje i spašavanje kako biste izbjegli mojibake.
- Batch uređuje u memoriji; save jednom kako bi se smanjila I/O.
- Normalizirajte EOL na opterećenju, pretvorite se u ciljni Eol na štednju.
- Koristite regex zamjenu za složenu čišćenje u jednom prolazu.
- U dugotrajnim uslugama, provjerite mjerenu upotrebu i dobro se nosite s kvotama.
FAQ
**Hoće li TXT sačuvati tablice, slike ili stilove?**No. TXT je ravni tekst; napredna formatacija je pletenirana.
**Mogu li se priključiti postojećem datoteku bez prepisivanja?**Otvorite FileStream u dodatnom načinu i napišite sačuvani izlaz na njega.
**Kako odabrati završnu liniju?**Setovi TxtSaveOptions.ParagraphBreak
na "\r\n"
(Windows ili "\n"
(Unix i MacOS).
**Kako isključiti UTF-8 BOM?**Korištenje new UTF8Encoding(false)
u TxtSaveOptions.Encoding
.
**Je li potrebna Office ili Notepad?**No. Aspose.Words je standalone.