Aspose.Words tekstitiedostojen käsittelijä .NET

Aspose.Words Text File Processor for .NET on kevyt API, joka keskittyy plain-tekstin skenaarioihin . Luo uusia tekstitiedostoja, ladata olemassa olevia .txt, suorittaa ohjelmattisia muokkauksia (sisältää, poistaa, korvata) ja palauta takaisin TXT tarkalla hallinnalla kooditusta , BOM jalinjan päättymistä – ihanteellinen palveluille, ETL-työpaikoille ja CI/CD-putkeille.

Toimi Windowsissa, Linuxissa ja macOS:ssa .NET Framework, .Net Core/5/6+, tai Mono.

Asennus ja asennus

**Tuetut skenaarioita: ** tiedostomenetelmät ja virrat (suositeltu web / pilvelle).

Nopea aloitus

Luo TXT-tiedosto (UTF-8 ja CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Lataa TXT nimenomaisella koodauksella, lisätä tekstiä, tallentaa LF:ksi

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Ominaisuudet ja toiminnallisuus

Dokumentti luominen

  • Aloita valkoisesta tekstin asiakirjasta muistiin.
  • Aseta **default koodaus ** ja EOL strategia säästettäessä.
  • Vaihtoehtoisesti kirjoita header/footer ** kommentit** ennen kehon tekstiä.

Lataa olemassa oleva TXT

  • Lataa path , stream tai byte[] automaattisen tunnistuksen tai pakollisen koodauksen avulla.
  • Suojaa tai normalisoida linjan murteet (CRLF / LF / CR) kuormituksella ja / tai säästämällä.
  • Virtaa hyvin suuria tiedostoja, jotta muisti pysyy vakaana.

Tekstin manipulointi

  • Siirry sisällön kautta tutun Document → Section → Paragraph → Run -mallin kautta.
  • Sisällytä, liitä tai poista teksti tarkissa paikoissa – ei manuaalista matemaattista korvausta.
  • Toimi bulk löytää / korvaa koko asiakirjan tai purettuja sarjoja.
  • jakaa / sekoittaa kappaleita tavanomaisilla määrittäjillä.

Säästää TXT

  • Tallenna tiedostoon tai **virta ** valitulla koodilla (UTF‐8/UTP‐16/ASCII/etc.).
  • Hallitse **BOM ** päästöjä ja ParagraphBreak (EOL) selkeästi.
  • Kirjoita uudelleen tai kirjoita kohteeseen, jonka hallitset.

Lataa & i18n

  • Täydellinen ** Unicode** tuki.
  • Läpinäkyvä palautuminen perintökoodin sivuille lukemisen aikana.
  • Tunnistaa ja säilyttää pommi kuormituksessa, ellei se ole liioiteltu.

Ensimmäinen APIs

  • Käytä StreamStream Web-palvelut ja pilvipalvelut.
  • Integroidaan helposti S3/Blob SDK:n ja muistin putkien kanssa.

Performance

  • Lean-objekti malli suorat tekstit.
  • Hyvät toiminnot vähentävät määrärahoja.
  • Thread-safe lukeminen; synkronointi kirjoittaa jaettaessa resursseja.

Yleisiä reseptejä

1) Regex Löydä / Vaihda (kollapsi useita tiloja)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 to UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalize Line Endings (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Vinkkejä ja parhaita käytäntöjä

  • Mieluummin stream-pohjaiset APIs suurille tiedostoille ja web-sovelluksille.
  • Aina asettaa koodaus lataukseen ja tallennukseen, jotta vältetään mojibake.
  • Batch muuttaa muistiin; ** säästää kerran** vähentää I/O:ta.
  • Normalisoida EOL kuormituksella, kääntää kohderyhmään.
  • Käytä regex korvaa monimutkaisiin puhdistuksiin yhdessä passissa.
  • Pitkäaikaisissa palveluissa tarkkaile mitattua käyttöä ja käsittele kvottia ystävällisesti.

FAQ

**Onko TXT säilyttänyt taulukoita, kuvia tai tyylejä?**No. TXT on tasainen teksti; edistyksellinen muotoilu on täynnä.

**Voinko liittää olemassa olevaan tiedostoon ilman liioittelua?**Avaa FileStream lisämuodossa ja kirjoita siihen tallennettu tulos. Varmista, että lisääte edellisen uutinen tarvittaessa.

**Miten voin valita lopullisen linjan?**Setissä TxtSaveOptions.ParagraphBreak että "\r\n" (Windowsin tai "\n" (Yhdistelmä ja macOS).

**Miten estän UTF-8 BOM:n?**Käytä new UTF8Encoding(false) Sisään TxtSaveOptions.Encoding.

**Onko Office tai Notepad ++ tarpeen?**No. Aspose.Words on erillinen.

 Suomi