Aspose.Words Text File Processor voor .NET
De Aspose.Words Text File Processor voor .NET is een lichtgewicht API gericht op plain-text scenario’s .txt
, uitvoeren van programmatische bewerkingen (invoeren, verwijderen, vervangen) en slaan terug naar TXT met nauwkeurige controle over encoding , BOM enline finish – ideaal voor diensten, ETL banen en CI/CD pipelines.
Het werkt op Windows, Linux en macOS met .NET Framework, .Net Core/5/6+, of Mono.
Installatie en Setup
- Installeer Aspose.Words van NuGet.
- Vraag uw licentie aan bij startups (zie Metered Licensing ).
- Overzicht systeemvereisten in de Installatie gids .
**Ondersteunde scenario’s: ** bestandpaden en streams (aanbevolen voor web/cloud).
Snelle start
Een TXT-bestand maken (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Laden van een TXT met uitdrukkelijke codering, toevoegen van tekst, opslaan als LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Features en functionaliteit
Document Creatie
- Begin met een witte tekstdocument in het geheugen.
- Set **default codering ** en EOL strategie bij besparing.
- Optioneel schrijf de header/footer commentaar voor lichaamstekst.
Laden bestaande TXT
- Load van path , stream of byte[] metcoding auto-detect of een gedwongen codering.
- Behoud of normaliseren van de lijnbreuken (CRLF / LF / CR) op lading en / of opslaan.
- Stream zeer grote bestanden om het geheugen stabiel te houden.
Tekstmanipulatie
- Grijp de inhoud via het bekende Document → Sectie → Paragraph → Run -model.
- Voer, toevoegen of verwijderen van tekst op nauwkeurige locaties – geen manuele offset materie.
- Voer bulk vinden / vervangen over het hele document of verspreide randen.
- Split / mix paragraaf door custom delimiters.
Sparen op TXT
- Save to file or **stream ** with chosen encoding (UTF‐8/UTM‐16/ASCII/etc.).
- Controleer de uitstoot **BOM ** en ParagraphBreak (EOL) uitdrukkelijk.
- Overschrijven of schrijven naar een doelstream die u beheert.
Inschrijving & i18n
- Volledige ** Unicode** ondersteuning.
- Transparante fouten voor legacy code pagina’s tijdens het lezen.
- Ontdek en bewaar Bom op de lading, tenzij overgedragen.
Stream-Eerste APIs
- Gebruik
Stream
→Stream
voor webdiensten en cloudfuncties. - Eenvoudig geïntegreerd met S3/Blob SDK’s en in-memory pipelines.
Performance
- Lean object model voor plain text.
- Lichte operaties minimaliseren toewijzingen.
- Thread-safe lezen; synchroniseren schrijft bij het delen van middelen.
gemeenschappelijke recepten
1) Regex vinden/vervangen (collapse meerdere ruimtes)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 tot UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalize Line Endings (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Tips en beste praktijken
- Prefereren stream-based APIs voor grote bestanden en web-apps.
- Altijd codeer op load & save om mojibake te voorkomen.
- Batch bewerkt in geheugen; save once om I/O te verminderen.
- Normaliseren EOL op de lading, om te zetten naar het doel Eol op het besparen.
- Gebruik regex vervangen voor complexe schoonmaken in één pass.
- In langdurige diensten monitoren we gemeten gebruik en beheren we de quota vriendelijk.
FAQ
**Heeft TXT tabellen, afbeeldingen of stijlen bewaard?**No. TXT is plain tekst; geavanceerde formatting is flatteerd.
**Kan ik toevoegen aan een bestaande bestand zonder over te schrijven?**Open een FileStream in toevoegingsmodus en schrijf de gereserveerde output op. Zorg ervoor dat u een voorafgaande nieuwslijn toegevoegd indien nodig.
**Hoe kies ik de eindlijn?**Set op TxtSaveOptions.ParagraphBreak
om te "\r\n"
(Windows of "\n"
(Unix en macOS).
**Hoe kan ik de UTF-8 BOM uitbreiden?**Gebruik new UTF8Encoding(false)
In de TxtSaveOptions.Encoding
.
**Is Office of Notepad++ nodig?**No. Aspose.Words is standalone.