Aspose.Words Textový procesor souborů pro .NET
Aspose.Words Text File Processor pro .NET je lehká API zaměřená na plain-textové scénáře .txt
, provádí programové úpravy (vložit, odstranit, nahradit) a používat zpět do TXT s přesnou kontrolou nad kódování , BOM aline konce – ideální pro služby, ETL práce a CI/CD potrubí.
Není požadován Microsoft Office. pracuje na Windows, Linuxu a macOSu s .NET Framework, .Net Core/5/6+, nebo Mono.
Instalace a nastavení
- Instalace Aspose.Words z NuGet.
- Aplikujte si licenci na startup (viz Metered Licensing ).
- Přezkoumání systémových požadavků v Installation Guide .
**Podporované scénáře: ** souborové trasy a streams (doporučené pro web / cloud).
rychlý start
Vytvoření souboru TXT (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Stáhněte TXT s explicitním kódováním, přidejte text, uložíte jako LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Funkce a funkčnost
Vytvoření dokumentu
- Začněte z bílého textového dokumentu v paměti.
- Nastavení **default kódování ** a EOL strategie při úsporách.
- Volitelně napište hlavičku / stopu ** komentáře** před textem těla.
Stávající TXT
- Nabíjejte z **path ** , **stream ** nebo **byte[] ** s kódováním auto-detekce či nuceným kódováním.
- Udržovat nebo normalizovat přerušení linie (CRLF / LF / CR) na zatížení a / nebo ušetření.
- Přenášejte velmi velké soubory, aby byla paměť stabilní.
Textová manipulace
- Přejděte do obsahu prostřednictvím známého modelu Dokument → Sekce → Odstavec → Spuštění.
- Vložte, přiložte nebo odstraňte text na přesných místech – žádná manuální matematika.
- Provádějte ** bulk nalézt / nahradit** po celém dokumentu nebo rozptýlených řadách.
- Rozdělení / smíření odstavců podle přizpůsobených delimitérů.
Úspora na TXT
- Uložte do souboru nebo **stream ** s vybraným kódováním (UTF‐8/UTP‐16/ASCII/etc.).
- Kontrola emisí **BOM ** a ParagraphBreak (EOL) výslovně.
- Přepíšte nebo napište do cílového toku, který spravujete.
Šifrování & i18n
- Úplná ** Unicode** podpora.
- Transparentní zpětné vazby na stránky dědického kódu při čtení.
- Detekce a zachování bomby na přetížení, pokud není přehnané.
Stream-První APIs
- Použití
Stream
→Stream
Webové služby a cloudové funkce. - Snadno se integruje s SDK S3/Blob a v paměti.
Performance
- Lean objekt model pro plochý text.
- Snadné operace minimalizují přidělování.
- Thread-safe čtení; synchronizace píše při sdílení zdrojů.
Společné recepty
Regex Find / Replace (kolaps více prostor)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 až UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalizace linií konců (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Tipy a nejlepší postupy
- Prefer stream-based API pro velké soubory a webové aplikace.
- Vždy nastavte kódování na nabití a ušetření, abyste se vyhnuli mojibaku.
- Batch edituje v paměti; save once ke snížení I/O.
- Normalizujte EOL na zatížení, konvertujte na cílový Eol na úsporu.
- Použijte regex náhradu pro komplexní čištění v jednom průchodu.
- V dlouhotrvajících službách monitoruje měřené používání a milosrdně se řídí kvótami.
FAQ
**Zachovává TXT tabulky, obrázky nebo styly?**No. TXT je plochý text; pokročilé formátování je pletené.
**Můžu se připojit k existujícímu souboru bez přepisování?**Otevřete FileStream v režimu dodatku a napište na něj uložený výstup. Ujistěte se, že v případě potřeby přidáte předchozí novelu.
**Jak vybrat linku končící?**Setování TxtSaveOptions.ParagraphBreak
do "\r\n"
(Windows nebo "\n"
(Unix a MacOS).
**Jak deaktivovat UTF-8 BOM?**Použití new UTF8Encoding(false)
v TxtSaveOptions.Encoding
.
**Potřebujete Office nebo Notepad?**No. Aspose.Words je samostatný.