Aspose.Words Procesor de fișiere text pentru .NET
Aspose.Words Text File Processor pentru .NET este o API ușoară axată pe scenarii de text plain . Creați noi fișiere text, încărcați existente .txt
, efectuați edite programatice (inser, șterge, înlocuiește) și save back la TXT cu control precis asupra codare , BOM șiline finish – ideal pentru servicii, locuri de muncă ETL și tuburi CI/CD.
Funcționează pe Windows, Linux și macOS cu .NET Framework, .Net Core/5/6+, sau Mono.
Instalare și setare
- Instalați Aspose.Words de la NuGet.
- Aplicați licența dvs. la startup (a se vedea Metered Licensing ).
- Verificarea cerințelor sistemului în Guida de instalare .
**Scenariile susținute: ** căi de fișier și streams (recomandate pentru web/cloud).
Începe rapid
Crearea unui fișier TXT (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Încărcați un TXT cu codare explicită, adăugați text, salvați ca LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Caracteristici și funcționalitate
Crearea documentului
- Începeți cu un document text alb în memorie.
- Setă o strategie de codare **default ** și EOL atunci când economisiți.
- Opțional, scrieți titlul/footerul Comentarii înainte de textul corpului.
Încărcarea existentă TXT
- Încărcați de la **path ** , **stream ** sau **byte[] ** cu codare auto-detect ori un codare forțată.
- Conservarea sau normalizarea rupturilor de linie (CRLF / LF / CR) pe încărcare și / sau salvare.
- Stream fișierele foarte mari pentru a menține memoria stabilă.
Manipularea textului
- Transferați conținutul prin modelul familiar Document → Secțiune → Paragraf → Run.
- Introduceți, adăugați sau ștergeți textul în locații precise – fără matematică manuală.
- Performanță bulk găsi / înlocuiește pe întregul document sau rânduri sculptate.
- Separați / amestecați paragrafele de către delimitatori personalizati.
Sfaturi pentru TXT
- Salvați-vă la fișier sau stream cu codarea selectată (UTF‐8 / UDF‐16 / ASCII / etc.).
- Controlul emisiilor **BOM ** și ParagraphBreak (EOL) explicit.
- Încărcați sau scrieți la un flux țintă pe care îl gestionați.
Etichetă: i18n
- Suport complet pentru unicode.
- Falsificări transparente pentru paginile de cod de moștenire atunci când citiți.
- Detectarea şi păstrarea bombă pe încărcătură, cu excepția cazului în care este supraîncărcat.
Primul APIs
- Utilizarea
Stream
→Stream
pentru serviciile web și funcțiile cloud. - Integrați cu ușurință cu SDK-urile S3/Blob și cu tuburile in-memorie.
Performance
- Modelul obiectului Lean pentru text plain.
- Operațiunile ușoare minimizează alocările.
- Citește în siguranță; sincronizează scrierea atunci când partajați resurse.
Rețete comune
1) Regex găsi / înlocuiește (collapse multiple spații)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 până la UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
Normalizarea terminărilor liniilor (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Sfaturi și cele mai bune practici
- Prefer stream-based API-uri pentru fișierele mari și aplicațiile web.
- Întotdeauna setarea codului pe încărcare și salvare pentru a evita mojibake.
- Batch editează în memorie; Save o dată pentru a reduce I/O.
- Normalizează EOL pe încărcare, convertează-te la țintă Eol pe economisire.
- Utilizați regex înlocuiește pentru curățări complexe într-un singur pas.
- În serviciile pe termen lung, monitorizați utilizarea măsurată și gestionați cu plăcere cota.
FAQ
**TXT păstrează tabele, imaginile sau stilurile?**TXT este text clar; formatarea avansată este flatulentă.
**Pot să mă aflu la un fișier existent fără supraîncărcare?**Deschideți o FileStream în modul de extindere și scrieți ieșirea salvată la ea. Asigurați-vă că adăugați un newline precedent dacă este necesar.
**Cum pot alege linia finală?**Setul TxtSaveOptions.ParagraphBreak
pentru "\r\n"
(Windows sau "\n"
(Unix și macOS).
**Cum pot dezactiva UTF-8 BOM?**Utilizarea new UTF8Encoding(false)
în TxtSaveOptions.Encoding
.
**Este necesar Office sau Notepad?**No. Aspose.Words este independent.