Aspose.Words teksto failų procesorius .NET

Aspose.Words teksto failų tvarkyklė .NET yra lengvas API, orientuotas į plain-text scenarijus .txt, atlikite programinius redagavimus (įveskite, ištrinkite, pakeiskite) ir taupykite atgal į TXT su tiksliu kodavimo, BOM ir linijos pabaigos kontrolės būdu – idealiai tinka paslaugoms, ETL darbams ir CI/CD vamzdžiams.

Jis veikia „Windows“, „Linux“ ir „macOS“ su .NET Framework, „NET Core/5/6+“ arba „Mono.

Įdiegimas ir nustatymas

Palaikomi scenarijai: ** failų maršrutai ir ** srautai (rekomenduojami žiniatinklio / debesyje).

Greitas pradžia

Sukurkite TXT failą (UTF‐8, CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Atsisiųskite TXT su aišku kodavimu, pridėkite tekstą, išsaugokite kaip LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Savybės ir funkcionalumas

Dokumentų kūrimas

  • Pradėkite nuo balto teksto dokumento atmintyje.
  • Taikykite default kodavimo ir EOL strategiją sutaupant.
  • Pasirinktinai prieš kūno tekstą parašykite pavadinimą / žingsnį komentarus.

Įkrovimas esamas TXT

  • Atsisiųskite iš path, stream arba byte[] su koduoto auto-detekto ar priverstinio kodavimo.
  • Išsaugoti arba normalizuoti linijos lūžius (CRLF / LF / CR) ant apkrovos ir (arba) sutaupyti.
  • Sumažinkite labai didelius failus, kad atmintis būtų stabili.

Teksto manipuliavimas

  • Peržengti turinį per pažįstamą Dokumentas → Skirsnis → Pareiškimas → Veiksmas modelį.
  • Įveskite, pridėkite arba ištrinkite tekstą tiksliose vietose – ne rankiniu atlyginimu.
  • Atlikite bulk surasti / pakeisti visame dokumente arba apšviestoje eilutėje.
  • Skirstykite / sumaišykite skirsnius pagal įprastus delimitatorius.

Išsaugoti TXT

  • Išsaugoti į failą arba stream su pasirinktu ** kodavimo** (UTF‐8/UTP‐16/ASCII/etc.).
  • Kontroliuoti BOM emisiją ir ParagraphBreak (EOL) aiškiai.
  • Perrašykite arba rašykite į tikslinį srautą, kurį valdote.

Šifravimas & i18n

  • Visiškas ** Unicode** palaikymas.
  • Skaidrūs paveldėjimo kodo puslapiai skaitymo metu.
  • Aptikti ir išsaugoti Bomba Įkrovimas, nebent jis yra perpildytas.

Stream-Pirmasis APIs

  • Use StreamStream interneto paslaugų ir debesų funkcijų.
  • Lengvai integruojamas su S3/Blob SDK ir atminties vamzdžiais.

Performance

  • Lean objektų modelis plačiajam tekstei.
  • Sunkūs veiksmai sumažina paskirstymo įmokas.
  • Thread-safe skaityti; sinchronizuoti rašo, kai dalijasi ištekliais.

Bendras receptas

Regex Find/Replace“ (daugelio erdvės susijungimas)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 į UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalizuoti linijos pabaigos (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Patarimai ir geriausios praktikos

  • Pageidautina stream-based API dideliems failams ir žiniatinklio programoms.
  • Visada nustatykite kodavimą ant įkrovimo ir išsaugojimo, kad išvengtumėte mojibake.
  • Batch“ redaguoja atmintyje; taupykite vieną kartą, kad sumažintumėte I/O.
  • Normalizuokite EOL ant apkrovos, konvertuokite į tikslinį „EOL“ ant taupymo.
  • Naudokite regex pakaitalą sudėtingoms valymui vienoje vietoje.
  • Ilgalaikėse paslaugose stebėkite matuojamą naudojimą ir maloniai tvarkykite kvotą.

FAQ

**Ar TXT išsaugo lenteles, vaizdus ar stilius?**TXT yra aiškus tekstas; pažangus formatuojamas.

**Ar galiu pridėti prie esamo failo be perrašymo?**Atidarykite FileStream papildomo režimo ir įveskite išsaugotą išeitį.

**Kaip aš galiu pasirinkti pabaigos liniją?**Set TxtSaveOptions.ParagraphBreak Į "\r\n" (Windows“ arba "\n" (Unix“ ir „MacOS).

**Kaip išjungti UTF-8 BOM?**Use new UTF8Encoding(false) Į TxtSaveOptions.Encoding.

**Ar reikia „Office“ ar „Notepad?**Ne. Aspose.Words yra standalone.

 Lietuvių