Aspose.Words Text File Processor voor .NET

De Aspose.Words Text File Processor voor .NET is een lichtgewicht API gericht op plain-text scenario’s .txt, uitvoeren van programmatische bewerkingen (invoeren, verwijderen, vervangen) en slaan terug naar TXT met nauwkeurige controle over encoding , BOM enline finish – ideaal voor diensten, ETL banen en CI/CD pipelines.

Het werkt op Windows, Linux en macOS met .NET Framework, .Net Core/5/6+, of Mono.

Installatie en Setup

**Ondersteunde scenario’s: ** bestandpaden en streams (aanbevolen voor web/cloud).

Snelle start

Een TXT-bestand maken (UTF‐8, CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Laden van een TXT met uitdrukkelijke codering, toevoegen van tekst, opslaan als LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Features en functionaliteit

Document Creatie

  • Begin met een witte tekstdocument in het geheugen.
  • Set **default codering ** en EOL strategie bij besparing.
  • Optioneel schrijf de header/footer commentaar voor lichaamstekst.

Laden bestaande TXT

  • Load van path , stream of byte[] metcoding auto-detect of een gedwongen codering.
  • Behoud of normaliseren van de lijnbreuken (CRLF / LF / CR) op lading en / of opslaan.
  • Stream zeer grote bestanden om het geheugen stabiel te houden.

Tekstmanipulatie

  • Grijp de inhoud via het bekende Document → Sectie → Paragraph → Run -model.
  • Voer, toevoegen of verwijderen van tekst op nauwkeurige locaties – geen manuele offset materie.
  • Voer bulk vinden / vervangen over het hele document of verspreide randen.
  • Split / mix paragraaf door custom delimiters.

Sparen op TXT

  • Save to file or **stream ** with chosen encoding (UTF‐8/UTM‐16/ASCII/etc.).
  • Controleer de uitstoot **BOM ** en ParagraphBreak (EOL) uitdrukkelijk.
  • Overschrijven of schrijven naar een doelstream die u beheert.

Inschrijving & i18n

  • Volledige ** Unicode** ondersteuning.
  • Transparante fouten voor legacy code pagina’s tijdens het lezen.
  • Ontdek en bewaar Bom op de lading, tenzij overgedragen.

Stream-Eerste APIs

  • Gebruik StreamStream voor webdiensten en cloudfuncties.
  • Eenvoudig geïntegreerd met S3/Blob SDK’s en in-memory pipelines.

Performance

  • Lean object model voor plain text.
  • Lichte operaties minimaliseren toewijzingen.
  • Thread-safe lezen; synchroniseren schrijft bij het delen van middelen.

gemeenschappelijke recepten

1) Regex vinden/vervangen (collapse meerdere ruimtes)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 tot UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalize Line Endings (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Tips en beste praktijken

  • Prefereren stream-based APIs voor grote bestanden en web-apps.
  • Altijd codeer op load & save om mojibake te voorkomen.
  • Batch bewerkt in geheugen; save once om I/O te verminderen.
  • Normaliseren EOL op de lading, om te zetten naar het doel Eol op het besparen.
  • Gebruik regex vervangen voor complexe schoonmaken in één pass.
  • In langdurige diensten monitoren we gemeten gebruik en beheren we de quota vriendelijk.

FAQ

**Heeft TXT tabellen, afbeeldingen of stijlen bewaard?**No. TXT is plain tekst; geavanceerde formatting is flatteerd.

**Kan ik toevoegen aan een bestaande bestand zonder over te schrijven?**Open een FileStream in toevoegingsmodus en schrijf de gereserveerde output op. Zorg ervoor dat u een voorafgaande nieuwslijn toegevoegd indien nodig.

**Hoe kies ik de eindlijn?**Set op TxtSaveOptions.ParagraphBreak om te "\r\n" (Windows of "\n" (Unix en macOS).

**Hoe kan ik de UTF-8 BOM uitbreiden?**Gebruik new UTF8Encoding(false) In de TxtSaveOptions.Encoding.

**Is Office of Notepad++ nodig?**No. Aspose.Words is standalone.

 Nederlands