Aspose.Words Text File Processor pre .NET
Aspose.Words Text File Processor pre .NET je ľahká API zameraná na plain-text scenáre .txt
, vykonajte programové úpravy (vložiť, odstrániť, nahradiť) a save back to TXT s presnou kontrolou nad kodovanie , BOM aline končatín – ideálne pre služby, ETL práce a CI/CD potrubia.
Nie je potrebný Microsoft Office. pracuje na systémoch Windows, Linux a macOS s .NET Framework, .Net Core/5/6+, alebo Mono.
Inštalácia a nastavenie
- Inštalovať Aspose.Words z NuGet.
- Aplikujte svoju licenciu na startup (pozri Metered Licensing ).
- Preskúmať systémové požiadavky v Inštalácia Sprievodca .
**Podporované scenáre: ** súborové trasy a streams (odporúčané pre web / cloud).
rýchly štart
Vytvorenie súboru TXT (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Nahrať TXT s explicitným kódovaním, pridať text, uložiť ako LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Funkcie a funkčnosť
Vytvorenie dokumentu
- Začnite s bielym textovým dokumentom v pamäti.
- Nastaviť **default kódovanie ** a EOL stratégiu pri úspore.
- Opcionálne napíšte hlavičku / stopu ** komentáre** pred textom tela.
Stiahnuť existujúce TXT
- Nahrať z **path ** , **stream ** alebo **byte[] ** s kódovaním auto-detekt a/alebo núteným kódovaním.
- Udržať alebo normalizovať prerušenia línie (CRLF / LF / CR) na zaťaženie a / alebo ušetrenie.
- Stream veľmi veľké súbory udržať pamäť stabilné.
Textová manipulácia
- Prejdite cez obsah prostredníctvom známych Dokument → Sekcia → Paragraf → Run modelov.
- Vložte, doplňte alebo odstráňte text na presných miestach – žiadne manuálne odpočítanie matematiky.
- Vykonajte bulk nájsť / nahradiť v celom dokumente alebo rozptýlených reťazcoch.
- Rozdeliť / zmiešať odseky zvyčajnými delimitérmi.
Úspora na TXT
- Uložiť do súboru alebo **stream ** s vybraným kódovaním (UTF‐8/UTP‐16/ASCII/etc.).
- Kontrola **BOM ** emisií a ParagraphBreak (EOL) výslovne.
- Prepíšte alebo napíšete do cieľového prúdu, ktorý spravujete.
Šifrovanie & i18n
- Úplná ** Unicode** podpora.
- Transparentné zlyhania pre stránky kódu dedičstva pri čítaní.
- Detekcia a zachovanie Bomba v záťaži, pokiaľ nie je nadmerné.
Stream-Prvý APIs
- Použitie
Stream
→Stream
pre webové služby a cloudové funkcie. - Jednoducho sa integruje s S3/Blob SDK a in-memory potrubím.
Performance
- Lean objekt model pre plochý text.
- Účinné operácie minimalizujú pridelenie.
- Bezpečné čítanie; synchronizácia píše pri zdieľaní zdrojov.
Spoločné recepty
1) Regex nájsť / nahradiť (kolaps viacero priestorov)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 až UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalizácia linkových koncov (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Tipy a najlepšie postupy
- Preferuje stream-based API pre veľké súbory a webové aplikácie.
- Vždy nastaviť kódovanie na zaťaženie a uloženie, aby sa zabránilo mojibake.
- Batch edituje v pamäti; save raz na zníženie I/O.
- Normalizujte EOL na zaťaženie, obráťte sa na cieľové Eol na úsporu.
- Použite regex náhradu pre komplexné čistenie v jednom priebehu.
- V dlhotrvajúcich službách monitoruje merané používanie a charitatívne sa zaoberá kvótami.
FAQ
**TXT zachováva tabuľky, obrázky alebo štýly?**TXT je plochý text; pokročilé formátovanie je platené.
**Môžem sa pripojiť k existujúcemu súboru bez prepisovania?**Otvorte FileStream v režime doplnenia a zadajte na ňu uložený výstup. Uistite sa, že v prípade potreby pridáte predchádzajúcu novú čiaru.
**Ako si vybrať finálovú linku?**nastavenie TxtSaveOptions.ParagraphBreak
na "\r\n"
(Windows alebo "\n"
(Unix alebo MacOS).
**Ako môžem vypnúť UTF-8 BOM?**Použitie new UTF8Encoding(false)
v TxtSaveOptions.Encoding
.
**Je potrebný Office alebo Notepad?**No. Aspose.Words je samostatný.