Aspose.Words teksta failu apstrādātājs .NET

Aspose.Words teksta failu apstrādātājs .NET ir viegls API, kas koncentrējas uz plain-text scenārijiem .txt, veikti programmatiskie rediģējumi (pievieno, dzēš, aizstāj), un save atpakaļ uz TXT ar precīzu kontroli par kodēšanu, BOM un line beigas - ideāli piemēroti pakalpojumiem, ETL darbiem un CI/CD caurulēm.

Microsoft Office nav nepieciešams. darbojas Windows, Linux un macOS ar .NET Framework, .Net Core/5/6+, vai Mono.

Instalācija un uzstādīšana

Atbalstītie scenāriji: failu maršruti un strēmi (rekomendēti tīmekļa / mākoņa lietotājiem).

Ātrs sākums

TXT faila izveide (UTF‐8, CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Lejupielādēt TXT ar skaidru kodēšanu, pievienot tekstu, saglabāt kā LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Iezīmes un funkcionalitāte

Dokumentu radīšana

  • Sāciet ar baltu teksta dokumentu atmiņā.
  • Iestatīt default kodēšanas un EOL stratēģiju ietaupīšanas laikā.
  • Ieteicams rakstīt virsrakstu / pēdas ** komentārus** pirms ķermeņa teksta.

Lietojot esošo TXT

  • Lejupielādēt no path, stream vai byte[] ar kodu auto-detektu un piespiedu kodēšanu.
  • Saglabāt vai normalizēt līnijas pārtraukumus (CRLF / LF / CR) uz slodzes un / vai ietaupīt.
  • Pārsūtīt ļoti lielas failus, lai saglabātu atmiņu stabilu.

Teksta manipulācija

  • Pārslēdziet saturu, izmantojot pazīstamo Dokuments → Sekcija → Paraksts → Run modeli.
  • Ievadiet, piestipriniet vai izdzēstiet tekstu precīzās vietās – nav manuālās atlaides matemātikas.
  • Izveidojiet ** bulk atrast / aizstāt** visā dokumentā vai izslēgto rangu.
  • sadalīt / apvienot punktus ar personalizētiem delimitoriem.

Ieguldījums TXT

  • Iegūstiet failu vai stream ar izvēlēto kodēšanu (UTF‐8/UTP‐16/ASCII/etc.).
  • Kontrolēt BOM emisijas un ParagraphBreak (EOL) skaidri.
  • Pārrakstīt vai rakstīt uz mērķa plūsmu, ko pārvaldāt.

Iepakojums & i18n

  • Pilna ** Unicode** atbalsts.
  • Pārredzamas atgriešanās mantojuma kodu lapām lasīšanas laikā.
  • Atzīt un saglabāt Bomba uz slodzes, ja vien nav pārspīlēts.

Stream-Pirms APIs

  • Use StreamStream tīmekļa pakalpojumiem un mākoņu funkcijām.
  • Vienkārši integrējiet ar S3/Blob SDK un atmiņas caurulēm.

Performance

  • Lean objekta modelis plašam tekstam.
  • Lāzās operācijas samazina piešķīrumus.
  • Thread-safe lasīšana; sinhronizācija raksta, dalot resursus.

Kopīgas receptes

1) Regex atrast / aizstāt (collapse vairāku telpu)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 uz UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalizēt līnijas beigas (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Tips & Labākās prakses

  • Prefer stream-based API lieliem failiem un tīmekļa lietojumiem.
  • Vienmēr iestatīt kodēšanu uz slodzi un saglabāt, lai izvairītos no mojibake.
  • Batch rediģē atmiņā; ** glabā vienu reizi**, lai samazinātu I/O.
  • Normalizēt EOL uz slodzes, konvertēt uz mērķtiecīgu Eol uz ietaupījumu.
  • Izmantojiet regex aizstāj sarežģītu tīrīšanu vienā pasē.
  • Ilgtermiņa pakalpojumos uzrauga mērītu lietošanu un labprāt pārvalda kvotu.

FAQ

**Vai TXT saglabā tabulas, attēlus vai stili?**TXT ir plašs teksts; paplašināts formāts ir plātināts.

**Vai es varu pievienot esošo failu bez pārrakstīšanas?**Atvērt FileStream pielikuma režīmā un uzrakstīt ietaupīto iznākumu.

**Kā es varu izvēlēties līniju beigas?**Set TxtSaveOptions.ParagraphBreak Lai "\r\n" (Windows vai "\n" (Un tas ir UNIX / MACOS).

**Kā es izslēdzu UTF-8 BOM?**Use new UTF8Encoding(false) Iekšējā TxtSaveOptions.Encoding.

**Vai ir nepieciešams Office vai Notepad?**No Aspose.Words ir standalone.

 Latviski