Aspose.Words Text File Processor за .NET

Aspose.Words Text File Processor за .NET е лек API, фокусиран върху plain-text сценарии .txt, Извършване на програмни редакти (включване, изтриване, замяна) и спазване обратно в TXT с точен контрол над кодиране , BOM илинейни крайници – идеален за услуги, ETL работни места и CI/CD тръби.

Работи на Windows, Linux и macOS с .NET Framework, .Net Core/5/6+, или Mono.

Инсталация и инсталиране

Поддържани сценарии: ** файлови пътища и ** потоци (препоръчва се за уеб / облак).

Бързо стартиране

Създаване на TXT файл (UTF‐8, CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Изтеглете TXT с експлицитно кодиране, добавете текст, спестете като LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Характеристики и функционалност

Създаване на документи

  • Започнете с бял текст в паметта.
  • Настройване на **предварително кодиране ** и EOL стратегия при спестяване.
  • Опционално напишете заглавието / стъпката ** коментари** преди текста на тялото.

Изтегляне на съществуващ TXT

  • Изтегляне от path , stream или byte[] скодиране на авто-детек или принудително кодирање.
  • Запазване или нормализиране на линиите (CRLF / ЛФ / CR) на зареждане и / или спасяване.
  • Прехвърлете много големи файлове, за да поддържате паметта стабилна.

Манипулация на текста

  • Преминавайте през съдържанието чрез познатия Документ → Раздел → Параграф → Извършване модел.
  • Вмъкнете, добавете или изтрийте текст на точни места – без ръчна математика.
  • Извършване ** bulk find/replace** по целия документ или разкрити редове.
  • Разделяне / смесване на параграфи от персонализирани делимитери.

Спестяване на TXT

  • Съхранявайте към файла или **stream ** с избраното кодиране (UTF‐8/UTФ‐16/ASCII/ и т.н.).
  • Контролиране на емисиите **BOM ** и ParagraphBreak (EOL) изрично.
  • Преписате или напишете към целевия поток, който управлявате.

Кодиране & i18n

  • Пълна ** Unicode** поддръжка.
  • Прозрачни фалшификати за страници с наследствен код при четене.
  • Откриване и запазване бомба Натоварване, освен ако не е излишно.

Първият поток APIs

  • Използване StreamStream За уеб услуги и облачни функции.
  • Лесно се интегрира с S3/Blob SDK и в-паметни тръби.

Performance

  • Модел на обекта Lean за плосък текст.
  • Лесни операции минимизират разпределението.
  • Thread-safe четене; синхронизиране пише при споделяне на ресурси.

Общи рецепти

Regex Find / Replace (съединяване на няколко пространства)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Поток→Поток (Windows‐1252 до UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

Нормализиране на крайните линии (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Съвети и най-добри практики

  • Предпочита stream-базирани APIs за големи файлове и уеб приложения.
  • Винаги поставете кодиране върху зареждане и съхранение, за да избегнете мохибака.
  • Батч редактира в паметта; ** спести веднъж** за намаляване на I/O.
  • Нормализирайте EOL на зареждане, конвертирайте към целенасочено Eol на спестяване.
  • Използвайте regex заместване за сложни почиствания в един проход.
  • В дълготрайни услуги, мониториране на измерваното използване и да се справят с квотите милосърдно.

FAQ

**Дали TXT запазва таблици, изображения или стилове?**No. TXT е чист текст; усъвършенстваното форматиране е флатентно.

**Мога ли да добавя към съществуващ файл, без да препиша?**Отворете FileStream в режим на допълнение и напишете изхода, който сте спасили. Уверете се, че добавяте предишна новост, ако е необходимо.

**Как да изберем крайната линия?**сет TxtSaveOptions.ParagraphBreak за "\r\n" (Windows или "\n" (УНИКС и МАКОС).

**Как да изключим UTF-8 BOM?**Използване new UTF8Encoding(false) в TxtSaveOptions.Encoding.

**Необходим ли е Office или Notepad?**No. Aspose.Words е самостоятелен.

 Български