Aspose.Words tekstfilprocesor til .NET
Aspose.Words Text File Processor for .NET er en letvægtig API, der fokuserer på plain-text scenarier .txt
, udfører programmerede redigeringer (indtast, slette, erstatte), og save tilbage til TXT med præcis kontrol over kodning , BOM ogline endinger – ideel til tjenester, ETL jobs og CI/CD pipeliner.
Virker på Windows, Linux og macOS med .NET Framework, .Net Core/5/6+, eller Mono.
Installation og installation
- Installere Aspose.Words fra NuGet.
- Ansøg om din licens ved start (se Metered Licensing ).
- Anmeldelse af systemkravene i Installation Guide .
**Støtte scenarier: ** filveje og streams (foreslået for web/cloud).
Hurtig start
Skab en TXT-fil (UTF-8 og CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Lad en TXT med eksplicit kodning, tilføje tekst, gem som LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Funktioner og funktionalitet
Dokumenter Skabelse
- Start med et hvidt tekstdokument i hukommelsen.
- Indsæt **default kodning ** og EOL strategi, når du sparer.
- Optionelt skrive header/footer ** kommentarer** før body text.
Opladning af eksisterende TXT
- Opladning fra path , stream eller byte[] medcoding auto-detect eller en tvunget koding.
- Bevare eller normalisere linjebrud (CRLF / LF / CR) på opladning og / eller lagring.
- Stream meget store filer for at holde hukommelsen stabil.
Tekst manipulation
- Gå gennem indholdet via den kendte Dokument → Sektion → Paragraf → Run model.
- Indsæt, tilføje eller slette tekst på præcise steder – ingen manuel offset matematik.
- Udføre ** bulk find/replace** over hele dokumentet eller sparkede rækker.
- Deling/mægning af afsnit ved brug af custom delimiters.
Besparelser til TXT
- Save til filen eller **stream ** med den valgte kodning (UTF‐8/UTM‐16/ASCII/etc.).
- Kontroller **BOM ** emissioner og ParagraphBreak (EOL) udtrykkeligt.
- Overskrive eller skrive til en målstrøm, du administrerer.
Skærm & i18n
- Fuld ** Unicode** støtte.
- Gennemsigtig falderback for arv koder sider, når du læser.
- Detekterer og bevarer Bomber på belastning, medmindre den overdrives.
Stream-First APIs
- Brug af
Stream
→Stream
for webtjenester og cloudfunktioner. - Integrer nemt med S3/Blob SDK’er og in-memory pipeliner.
Performance
- Lean-objektsmodellen til plain tekst.
- Læge operationer minimerer tildelinger.
- Thread-safe læsning; synkronisering skriver, når man deler ressourcer.
Vanlige opskrifter
1) Regex Find/Replace (collapse flere rum)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 til UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalisere linje afslutninger (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Tips og bedste praksis
- Foretrækker stream-baserede APIs til store filer og webapps.
- Altid indstille kodning på Load & Save for at undgå mojibake.
- Batch redigerer i hukommelsen; save en gang for at reducere I/O.
- Normaliser EOL på opladning, konverter til mål Eol på besparelse.
- Brug regex udskiftning til komplekse rengøringer i én pass.
- I langvarige tjenester overvåger vi målt brug og håndterer kvoter med barmhjertighed.
FAQ
**Bevarer TXT tabeller, billeder eller stilarter?**TXT er klar tekst; avanceret formatering er flatte.
**Kan jeg tilføje til en eksisterende fil uden at overskrive?**Åbn en FileStream i tilføjelsesmodus og skriv den sparede udgang til den. Sørg for, at du tilføjer en forudgående nylinje, hvis det er nødvendigt.
**Hvordan vælger jeg linjen slut?**Sæt TxtSaveOptions.ParagraphBreak
til "\r\n"
(Windows eller "\n"
(Det er UNIX og MACOS).
**Hvordan kan jeg deaktivere UTF-8 BOM?**Brug af new UTF8Encoding(false)
I TxtSaveOptions.Encoding
.
**Er Office eller Notepad ++ nødvendigt?**LÆS OGSÅ: Aspose.Words er standalone.