Aspose.Words tekstfilprocesor til .NET

Aspose.Words Text File Processor for .NET er en letvægtig API, der fokuserer på plain-text scenarier .txt, udfører programmerede redigeringer (indtast, slette, erstatte), og save tilbage til TXT med præcis kontrol over kodning , BOM ogline endinger – ideel til tjenester, ETL jobs og CI/CD pipeliner.

Virker på Windows, Linux og macOS med .NET Framework, .Net Core/5/6+, eller Mono.

Installation og installation

**Støtte scenarier: ** filveje og streams (foreslået for web/cloud).

Hurtig start

Skab en TXT-fil (UTF-8 og CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Lad en TXT med eksplicit kodning, tilføje tekst, gem som LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Funktioner og funktionalitet

Dokumenter Skabelse

  • Start med et hvidt tekstdokument i hukommelsen.
  • Indsæt **default kodning ** og EOL strategi, når du sparer.
  • Optionelt skrive header/footer ** kommentarer** før body text.

Opladning af eksisterende TXT

  • Opladning fra path , stream eller byte[] medcoding auto-detect eller en tvunget koding.
  • Bevare eller normalisere linjebrud (CRLF / LF / CR) på opladning og / eller lagring.
  • Stream meget store filer for at holde hukommelsen stabil.

Tekst manipulation

  • Gå gennem indholdet via den kendte Dokument → Sektion → Paragraf → Run model.
  • Indsæt, tilføje eller slette tekst på præcise steder – ingen manuel offset matematik.
  • Udføre ** bulk find/replace** over hele dokumentet eller sparkede rækker.
  • Deling/mægning af afsnit ved brug af custom delimiters.

Besparelser til TXT

  • Save til filen eller **stream ** med den valgte kodning (UTF‐8/UTM‐16/ASCII/etc.).
  • Kontroller **BOM ** emissioner og ParagraphBreak (EOL) udtrykkeligt.
  • Overskrive eller skrive til en målstrøm, du administrerer.

Skærm & i18n

  • Fuld ** Unicode** støtte.
  • Gennemsigtig falderback for arv koder sider, når du læser.
  • Detekterer og bevarer Bomber på belastning, medmindre den overdrives.

Stream-First APIs

  • Brug af StreamStream for webtjenester og cloudfunktioner.
  • Integrer nemt med S3/Blob SDK’er og in-memory pipeliner.

Performance

  • Lean-objektsmodellen til plain tekst.
  • Læge operationer minimerer tildelinger.
  • Thread-safe læsning; synkronisering skriver, når man deler ressourcer.

Vanlige opskrifter

1) Regex Find/Replace (collapse flere rum)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 til UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalisere linje afslutninger (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Tips og bedste praksis

  • Foretrækker stream-baserede APIs til store filer og webapps.
  • Altid indstille kodning på Load & Save for at undgå mojibake.
  • Batch redigerer i hukommelsen; save en gang for at reducere I/O.
  • Normaliser EOL på opladning, konverter til mål Eol på besparelse.
  • Brug regex udskiftning til komplekse rengøringer i én pass.
  • I langvarige tjenester overvåger vi målt brug og håndterer kvoter med barmhjertighed.

FAQ

**Bevarer TXT tabeller, billeder eller stilarter?**TXT er klar tekst; avanceret formatering er flatte.

**Kan jeg tilføje til en eksisterende fil uden at overskrive?**Åbn en FileStream i tilføjelsesmodus og skriv den sparede udgang til den. Sørg for, at du tilføjer en forudgående nylinje, hvis det er nødvendigt.

**Hvordan vælger jeg linjen slut?**Sæt TxtSaveOptions.ParagraphBreak til "\r\n" (Windows eller "\n" (Det er UNIX og MACOS).

**Hvordan kan jeg deaktivere UTF-8 BOM?**Brug af new UTF8Encoding(false) I TxtSaveOptions.Encoding.

**Er Office eller Notepad ++ nødvendigt?**LÆS OGSÅ: Aspose.Words er standalone.

 Dansk