Aspose.Words Textový procesor souborů pro .NET

Aspose.Words Text File Processor pro .NET je lehká API zaměřená na plain-textové scénáře .txt, provádí programové úpravy (vložit, odstranit, nahradit) a používat zpět do TXT s přesnou kontrolou nad kódování , BOM aline konce – ideální pro služby, ETL práce a CI/CD potrubí.

Není požadován Microsoft Office. pracuje na Windows, Linuxu a macOSu s .NET Framework, .Net Core/5/6+, nebo Mono.

Instalace a nastavení

**Podporované scénáře: ** souborové trasy a streams (doporučené pro web / cloud).

rychlý start

Vytvoření souboru TXT (UTF‐8, CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Stáhněte TXT s explicitním kódováním, přidejte text, uložíte jako LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Funkce a funkčnost

Vytvoření dokumentu

  • Začněte z bílého textového dokumentu v paměti.
  • Nastavení **default kódování ** a EOL strategie při úsporách.
  • Volitelně napište hlavičku / stopu ** komentáře** před textem těla.

Stávající TXT

  • Nabíjejte z **path ** , **stream ** nebo **byte[] ** s kódováním auto-detekce či nuceným kódováním.
  • Udržovat nebo normalizovat přerušení linie (CRLF / LF / CR) na zatížení a / nebo ušetření.
  • Přenášejte velmi velké soubory, aby byla paměť stabilní.

Textová manipulace

  • Přejděte do obsahu prostřednictvím známého modelu Dokument → Sekce → Odstavec → Spuštění.
  • Vložte, přiložte nebo odstraňte text na přesných místech – žádná manuální matematika.
  • Provádějte ** bulk nalézt / nahradit** po celém dokumentu nebo rozptýlených řadách.
  • Rozdělení / smíření odstavců podle přizpůsobených delimitérů.

Úspora na TXT

  • Uložte do souboru nebo **stream ** s vybraným kódováním (UTF‐8/UTP‐16/ASCII/etc.).
  • Kontrola emisí **BOM ** a ParagraphBreak (EOL) výslovně.
  • Přepíšte nebo napište do cílového toku, který spravujete.

Šifrování & i18n

  • Úplná ** Unicode** podpora.
  • Transparentní zpětné vazby na stránky dědického kódu při čtení.
  • Detekce a zachování bomby na přetížení, pokud není přehnané.

Stream-První APIs

  • Použití StreamStream Webové služby a cloudové funkce.
  • Snadno se integruje s SDK S3/Blob a v paměti.

Performance

  • Lean objekt model pro plochý text.
  • Snadné operace minimalizují přidělování.
  • Thread-safe čtení; synchronizace píše při sdílení zdrojů.

Společné recepty

Regex Find / Replace (kolaps více prostor)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 až UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalizace linií konců (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Tipy a nejlepší postupy

  • Prefer stream-based API pro velké soubory a webové aplikace.
  • Vždy nastavte kódování na nabití a ušetření, abyste se vyhnuli mojibaku.
  • Batch edituje v paměti; save once ke snížení I/O.
  • Normalizujte EOL na zatížení, konvertujte na cílový Eol na úsporu.
  • Použijte regex náhradu pro komplexní čištění v jednom průchodu.
  • V dlouhotrvajících službách monitoruje měřené používání a milosrdně se řídí kvótami.

FAQ

**Zachovává TXT tabulky, obrázky nebo styly?**No. TXT je plochý text; pokročilé formátování je pletené.

**Můžu se připojit k existujícímu souboru bez přepisování?**Otevřete FileStream v režimu dodatku a napište na něj uložený výstup. Ujistěte se, že v případě potřeby přidáte předchozí novelu.

**Jak vybrat linku končící?**Setování TxtSaveOptions.ParagraphBreak do "\r\n" (Windows nebo "\n" (Unix a MacOS).

**Jak deaktivovat UTF-8 BOM?**Použití new UTF8Encoding(false) v TxtSaveOptions.Encoding.

**Potřebujete Office nebo Notepad?**No. Aspose.Words je samostatný.

 Čeština