Aspose.Words Text File Processor pre .NET

Aspose.Words Text File Processor pre .NET je ľahká API zameraná na plain-text scenáre .txt, vykonajte programové úpravy (vložiť, odstrániť, nahradiť) a save back to TXT s presnou kontrolou nad kodovanie , BOM aline končatín – ideálne pre služby, ETL práce a CI/CD potrubia.

Nie je potrebný Microsoft Office. pracuje na systémoch Windows, Linux a macOS s .NET Framework, .Net Core/5/6+, alebo Mono.

Inštalácia a nastavenie

**Podporované scenáre: ** súborové trasy a streams (odporúčané pre web / cloud).

rýchly štart

Vytvorenie súboru TXT (UTF‐8, CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Nahrať TXT s explicitným kódovaním, pridať text, uložiť ako LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Funkcie a funkčnosť

Vytvorenie dokumentu

  • Začnite s bielym textovým dokumentom v pamäti.
  • Nastaviť **default kódovanie ** a EOL stratégiu pri úspore.
  • Opcionálne napíšte hlavičku / stopu ** komentáre** pred textom tela.

Stiahnuť existujúce TXT

  • Nahrať z **path ** , **stream ** alebo **byte[] ** s kódovaním auto-detekt a/alebo núteným kódovaním.
  • Udržať alebo normalizovať prerušenia línie (CRLF / LF / CR) na zaťaženie a / alebo ušetrenie.
  • Stream veľmi veľké súbory udržať pamäť stabilné.

Textová manipulácia

  • Prejdite cez obsah prostredníctvom známych Dokument → Sekcia → Paragraf → Run modelov.
  • Vložte, doplňte alebo odstráňte text na presných miestach – žiadne manuálne odpočítanie matematiky.
  • Vykonajte bulk nájsť / nahradiť v celom dokumente alebo rozptýlených reťazcoch.
  • Rozdeliť / zmiešať odseky zvyčajnými delimitérmi.

Úspora na TXT

  • Uložiť do súboru alebo **stream ** s vybraným kódovaním (UTF‐8/UTP‐16/ASCII/etc.).
  • Kontrola **BOM ** emisií a ParagraphBreak (EOL) výslovne.
  • Prepíšte alebo napíšete do cieľového prúdu, ktorý spravujete.

Šifrovanie & i18n

  • Úplná ** Unicode** podpora.
  • Transparentné zlyhania pre stránky kódu dedičstva pri čítaní.
  • Detekcia a zachovanie Bomba v záťaži, pokiaľ nie je nadmerné.

Stream-Prvý APIs

  • Použitie StreamStream pre webové služby a cloudové funkcie.
  • Jednoducho sa integruje s S3/Blob SDK a in-memory potrubím.

Performance

  • Lean objekt model pre plochý text.
  • Účinné operácie minimalizujú pridelenie.
  • Bezpečné čítanie; synchronizácia píše pri zdieľaní zdrojov.

Spoločné recepty

1) Regex nájsť / nahradiť (kolaps viacero priestorov)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 až UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalizácia linkových koncov (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Tipy a najlepšie postupy

  • Preferuje stream-based API pre veľké súbory a webové aplikácie.
  • Vždy nastaviť kódovanie na zaťaženie a uloženie, aby sa zabránilo mojibake.
  • Batch edituje v pamäti; save raz na zníženie I/O.
  • Normalizujte EOL na zaťaženie, obráťte sa na cieľové Eol na úsporu.
  • Použite regex náhradu pre komplexné čistenie v jednom priebehu.
  • V dlhotrvajúcich službách monitoruje merané používanie a charitatívne sa zaoberá kvótami.

FAQ

**TXT zachováva tabuľky, obrázky alebo štýly?**TXT je plochý text; pokročilé formátovanie je platené.

**Môžem sa pripojiť k existujúcemu súboru bez prepisovania?**Otvorte FileStream v režime doplnenia a zadajte na ňu uložený výstup. Uistite sa, že v prípade potreby pridáte predchádzajúcu novú čiaru.

**Ako si vybrať finálovú linku?**nastavenie TxtSaveOptions.ParagraphBreak na "\r\n" (Windows alebo "\n" (Unix alebo MacOS).

**Ako môžem vypnúť UTF-8 BOM?**Použitie new UTF8Encoding(false) v TxtSaveOptions.Encoding.

**Je potrebný Office alebo Notepad?**No. Aspose.Words je samostatný.

 Slovenčina