Aspose.Words teksto failų procesorius .NET
Aspose.Words teksto failų tvarkyklė .NET yra lengvas API, orientuotas į plain-text scenarijus .txt
, atlikite programinius redagavimus (įveskite, ištrinkite, pakeiskite) ir taupykite atgal į TXT su tiksliu kodavimo, BOM ir linijos pabaigos kontrolės būdu – idealiai tinka paslaugoms, ETL darbams ir CI/CD vamzdžiams.
Jis veikia „Windows“, „Linux“ ir „macOS“ su .NET Framework, „NET Core/5/6+“ arba „Mono.
Įdiegimas ir nustatymas
- Įdiegti Aspose.Words iš NuGet.
- Taikykite savo licenciją „Startup“ (žr Metered Licensing ).
- Apžvalgos sistemos reikalavimai Įdiegimo vadovas .
Palaikomi scenarijai: ** failų maršrutai ir ** srautai (rekomenduojami žiniatinklio / debesyje).
Greitas pradžia
Sukurkite TXT failą (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Atsisiųskite TXT su aišku kodavimu, pridėkite tekstą, išsaugokite kaip LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Savybės ir funkcionalumas
Dokumentų kūrimas
- Pradėkite nuo balto teksto dokumento atmintyje.
- Taikykite default kodavimo ir EOL strategiją sutaupant.
- Pasirinktinai prieš kūno tekstą parašykite pavadinimą / žingsnį komentarus.
Įkrovimas esamas TXT
- Atsisiųskite iš path, stream arba byte[] su koduoto auto-detekto ar priverstinio kodavimo.
- Išsaugoti arba normalizuoti linijos lūžius (CRLF / LF / CR) ant apkrovos ir (arba) sutaupyti.
- Sumažinkite labai didelius failus, kad atmintis būtų stabili.
Teksto manipuliavimas
- Peržengti turinį per pažįstamą Dokumentas → Skirsnis → Pareiškimas → Veiksmas modelį.
- Įveskite, pridėkite arba ištrinkite tekstą tiksliose vietose – ne rankiniu atlyginimu.
- Atlikite bulk surasti / pakeisti visame dokumente arba apšviestoje eilutėje.
- Skirstykite / sumaišykite skirsnius pagal įprastus delimitatorius.
Išsaugoti TXT
- Išsaugoti į failą arba stream su pasirinktu ** kodavimo** (UTF‐8/UTP‐16/ASCII/etc.).
- Kontroliuoti BOM emisiją ir ParagraphBreak (EOL) aiškiai.
- Perrašykite arba rašykite į tikslinį srautą, kurį valdote.
Šifravimas & i18n
- Visiškas ** Unicode** palaikymas.
- Skaidrūs paveldėjimo kodo puslapiai skaitymo metu.
- Aptikti ir išsaugoti Bomba Įkrovimas, nebent jis yra perpildytas.
Stream-Pirmasis APIs
- Use
Stream
→Stream
interneto paslaugų ir debesų funkcijų. - Lengvai integruojamas su S3/Blob SDK ir atminties vamzdžiais.
Performance
- Lean objektų modelis plačiajam tekstei.
- Sunkūs veiksmai sumažina paskirstymo įmokas.
- Thread-safe skaityti; sinchronizuoti rašo, kai dalijasi ištekliais.
Bendras receptas
Regex Find/Replace“ (daugelio erdvės susijungimas)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 į UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalizuoti linijos pabaigos (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Patarimai ir geriausios praktikos
- Pageidautina stream-based API dideliems failams ir žiniatinklio programoms.
- Visada nustatykite kodavimą ant įkrovimo ir išsaugojimo, kad išvengtumėte mojibake.
- Batch“ redaguoja atmintyje; taupykite vieną kartą, kad sumažintumėte I/O.
- Normalizuokite EOL ant apkrovos, konvertuokite į tikslinį „EOL“ ant taupymo.
- Naudokite regex pakaitalą sudėtingoms valymui vienoje vietoje.
- Ilgalaikėse paslaugose stebėkite matuojamą naudojimą ir maloniai tvarkykite kvotą.
FAQ
**Ar TXT išsaugo lenteles, vaizdus ar stilius?**TXT yra aiškus tekstas; pažangus formatuojamas.
**Ar galiu pridėti prie esamo failo be perrašymo?**Atidarykite FileStream papildomo režimo ir įveskite išsaugotą išeitį.
**Kaip aš galiu pasirinkti pabaigos liniją?**Set TxtSaveOptions.ParagraphBreak
Į "\r\n"
(Windows“ arba "\n"
(Unix“ ir „MacOS).
**Kaip išjungti UTF-8 BOM?**Use new UTF8Encoding(false)
Į TxtSaveOptions.Encoding
.
**Ar reikia „Office“ ar „Notepad?**Ne. Aspose.Words yra standalone.