Aspose.Words tekstfilprosessor for .NET
Aspose.Words Text File Processor for .NET er en mild API fokusert på plain-text scenarier .txt
, utfører programmatiske redigeringer (innsett, slette, erstatte), og save tilbake til TXT med nøyaktig kontroll over koding, BOM og linjeendinger – ideell for tjenester, ETL jobber, og CI/CD pipeliner.
Arbeider på Windows, Linux og macOS med .NET Framework, .Net Core/5/6+, eller Mono.
Installasjon og installasjon
- Installere Aspose.Words fra NuGet.
- Søk om lisens ved start (se Metered Licensing ).
- Oversikt over systemkravene i Installasjonsguide .
Støtt scenarier: filveier og strømmer (rekommendert for web/cloud).
Rask start
Lag en TXT-fil (UTF-8 og CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Last ned en TXT med eksplisitt koding, legge til tekst, lagre som LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Egenskaper og funksjonalitet
Dokumenter opprettelse
- Begynn med et hvitt tekstdokument i minnet.
- Sett default koding og EOL strategi når du sparer.
- Alternativt skriv header/footer ** kommentarer** før kroppstekst.
Last opp eksisterende TXT
- Last ned fra path, stream eller byte[] med kodeing av auto-detekt eller en tvunget koding.
- Bevare eller normalisere linjebrudd (CRLF / LF / CR) på belastning og / eller lagring.
- Stream svært store filer for å holde hukommelsen stabil.
Tekst Manipulasjon
- Gå gjennom innholdet via den kjente dokument → seksjon → paragraf → Run-modellen.
- Legg inn, vedlegg eller slett tekst på nøyaktige steder – ingen manuell offset matematikk.
- Gjør bulk finne / erstatte over hele dokumentet eller sprekke rader.
- Split/melt paragrafer av vanlige delimitatorer.
Sparer til TXT
- Lagre til filen eller strøm med valgt koding (UTF‐8/UT F‐16/ASCII/etc.).
- Kontroller BOM utslipp og ParagraphBreak (EOL) uttrykkelig.
- Oversett eller skriv til en målstrøm du administrerer.
Koding & i18n
- Full ** Unicode** støtte.
- Gjennomsiktige fallbacks for arv koden sider når du leser.
- Oppdag og beholde Bomber på belastning, med mindre den overdrives.
Stream-First APIs
- Use
Stream
→Stream
for web-tjenester og cloudfunksjoner. - Enkelt å integrere med S3/Blob SDKs og in-memory pipeliner.
Performance
- Lean objektmodell for flat tekst.
- Lange operasjoner minimerer tildelinger.
- Thread-safe lesing; synkronisering skriver når du deler ressurser.
Vanlige oppskrifter
1) Regex Find/Replace (kollapse flere rom)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 til UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalisere linje endinger (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Tips og beste praksis
- Foretrakk stream-baserte APIs for store filer og webapper.
- Always set encoding on load & save for å unngå mojibake.
- Batch redigerer i minnet; save en gang for å redusere I/O.
- Normalisere EOL på belastning, konvertere til mål Eol på sparing.
- Bruk regex erstatte for komplekse rengjøringer i ett pass.
- I langvarige tjenester, overvåke målt bruk og håndtere kvote med barmhjertighet.
FAQ
**Er TXT i stand til å beholde tabeller, bilder eller stiler?**No. TXT er flat tekst; avansert formatering er flattet.
**Kan jeg legge til en eksisterende fil uten å overskride?**Åpne en FileStream i tilleggsløsning og skriv inn den sparte utgangen til den. Sørg for at du legger til en tidligere nylinje hvis det er nødvendig.
**Hvordan velger jeg linjen som slutter?**Set TxtSaveOptions.ParagraphBreak
til "\r\n"
(Windows eller "\n"
(Unix og MacOS).
**Hvordan kan jeg deaktivere UTF-8 BOM?**Use new UTF8Encoding(false)
I TxtSaveOptions.Encoding
.
**Er Office eller Notepad++ nødvendig?**No. Aspose.Words er standalone.