Aspose.Words Text File Processor za .NET

Aspose.Words Text File Processor za .NET je API lagane težine usredsređen na plain-text scenarije .txt, извршите програмске уређаје (унесите, уклоните, замените), и спасите назад на ТКСТ са прецизном контролом над кодирањем , БОМ и линија завршетка-идеално за услуге, ЕТЛ послове и ЦИ / ЦД цеви.

Ne zahteva Microsoft Office. radi na Windows, Linux i macOS-u sa .NET Framework, .Net Core/5/6+, ili Mono.

Инсталација и подешавање

  • Инсталирајте Aspose.Words из NuGet.
  • Аплицирајте своју лиценцу на стартапу (види Умерено лиценцирање ).
  • Преглед системских захтева у [Упутство за инсталацију]128а4б716644/).

Подржани сценарији: ** Пут датотеке и ** Streams (препоручује се за веб / облак).

брз почетак

Креирање ТКСТ датотеке (УТФ-8, ЦРЛФ)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Преузмите ТКСТ са експлицитним кодирањем, додајте текст, сачувате као ЛФ

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Карактеристике и функционалност

Креирање документа

  • Почните са белог текстуалног документа у меморији.
  • Поставите **дефолт кодирање ** и ЕОЛ стратегију приликом штедње.
  • Опционално напишите наслов / стопала ** коментари** пре тела текста.

Преузимање постојеће ТКТ

  • Преузмите из пате , стрим или бите[] сакодирањем ауто-детекта или присиљеним кодирањем.
  • Заштита или нормализација линејских прекида (ЦРЛФ / ЛФ / ЦР) на оптерећењу и / или спасавање.
  • Преносите веома велике датотеке како би се задржала стабилна меморија.

Манипулација текста

  • Пређите садржај путем познатог Документа → Део → Параграф → Извод модела.
  • Унесите, додајте или избришете текст на прецизним локацијама – нема ручне математике.
  • Извршите ** bulk find/replace** широм целог документа или скраћених редова.
  • Раздвојити / мешати параграфе по прилагођеним делимитерима.

Ušteda za TXT

  • Сачувајте на датотеку или **stream ** са изабраним кодирањем (УТФ-8/УТВ-16/АСЦИИ/ итд.).
  • Контролисање емисије ** БОМ ** и ** ПараграфБрек** (ЕОЛ) изричито.
  • Преписати или писати на циљном току који управљате.

Кодирање & i18n

  • Потпуна подршка УНИКОД.
  • Transparentni padovi za stranice kodova nasleđa prilikom čitanja.
  • Истраживање и чување бомба на оптерећењу, осим ако се преоптерећује.

Стрејм-први АПИ

  • Коришћење StreamStream За веб услуге и функције облака.
  • Једноставно се интегрише са С3/Блоб СДК-ом и у меморијским цевима.

Performance

  • Lean objekt model za ravni tekst.
  • Лази операције минимизирају распореде.
  • Thread-safe čitanje; sinhronizacija piše prilikom deljenja resursa.

Уобичајени рецепти

1) Регекс проналажење/замена (колапс више простора)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 до UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Нормализација линија завршетка (ЦРЛФ → ЛФ)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Савети и најбоља пракса

  • Преферирају stream-базирани АПИ за велике датотеке и веб апликације.
  • Увек подесите кодирање на оптерећење и сачување како бисте избегли мохибаке.
  • Батцх уређује у меморији; ** уштедите једном** да бисте смањили И/О.
  • Нормалишете ЕОЛ на оптерећењу, конвертујте на циљ ЕОЛ на штедњу.
  • Користите регекс замену за сложене чишћења у једном пролазу.
  • У дуготрајним услугама, пратите мерено коришћење и милосрдно управљајте квотом.

FAQ

**Да ли ТКСТ чува табеле, слике или стилове?**ТКСТ је равни текст; напредни форматирање је флатентовано.

**Могу ли се придружити постојећем датотеку без преписивања?**Otvorite FileStream u dodatnom načinu i napišite sačuvani izlaz na njega.

**Како бих изабрао линију завршетка?**сет TxtSaveOptions.ParagraphBreak да "\r\n" (Виндовс или "\n" (УНИКС / МАКОС).

**Како могу да деактивирам УТФ-8 БОМ?**Коришћење new UTF8Encoding(false) у TxtSaveOptions.Encoding.

**Да ли је потребан Office или Notepad?**No. Aspose.Words je standalone.

 Српски