Aspose.Words Text File Processor за .NET
Aspose.Words Text File Processor за .NET е лек API, фокусиран върху plain-text сценарии .txt
, Извършване на програмни редакти (включване, изтриване, замяна) и спазване обратно в TXT с точен контрол над кодиране , BOM илинейни крайници – идеален за услуги, ETL работни места и CI/CD тръби.
Работи на Windows, Linux и macOS с .NET Framework, .Net Core/5/6+, или Mono.
Инсталация и инсталиране
- Инсталирайте Aspose.Words от NuGet.
- Задайте заявление за лиценз на стартиране (виж Metered Licensing ).
- Преглед на системните изисквания в Инсталационен ръководство .
Поддържани сценарии: ** файлови пътища и ** потоци (препоръчва се за уеб / облак).
Бързо стартиране
Създаване на TXT файл (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Изтеглете TXT с експлицитно кодиране, добавете текст, спестете като LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Характеристики и функционалност
Създаване на документи
- Започнете с бял текст в паметта.
- Настройване на **предварително кодиране ** и EOL стратегия при спестяване.
- Опционално напишете заглавието / стъпката ** коментари** преди текста на тялото.
Изтегляне на съществуващ TXT
- Изтегляне от path , stream или byte[] скодиране на авто-детек или принудително кодирање.
- Запазване или нормализиране на линиите (CRLF / ЛФ / CR) на зареждане и / или спасяване.
- Прехвърлете много големи файлове, за да поддържате паметта стабилна.
Манипулация на текста
- Преминавайте през съдържанието чрез познатия Документ → Раздел → Параграф → Извършване модел.
- Вмъкнете, добавете или изтрийте текст на точни места – без ръчна математика.
- Извършване ** bulk find/replace** по целия документ или разкрити редове.
- Разделяне / смесване на параграфи от персонализирани делимитери.
Спестяване на TXT
- Съхранявайте към файла или **stream ** с избраното кодиране (UTF‐8/UTФ‐16/ASCII/ и т.н.).
- Контролиране на емисиите **BOM ** и ParagraphBreak (EOL) изрично.
- Преписате или напишете към целевия поток, който управлявате.
Кодиране & i18n
- Пълна ** Unicode** поддръжка.
- Прозрачни фалшификати за страници с наследствен код при четене.
- Откриване и запазване бомба Натоварване, освен ако не е излишно.
Първият поток APIs
- Използване
Stream
→Stream
За уеб услуги и облачни функции. - Лесно се интегрира с S3/Blob SDK и в-паметни тръби.
Performance
- Модел на обекта Lean за плосък текст.
- Лесни операции минимизират разпределението.
- Thread-safe четене; синхронизиране пише при споделяне на ресурси.
Общи рецепти
Regex Find / Replace (съединяване на няколко пространства)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Поток→Поток (Windows‐1252 до UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
Нормализиране на крайните линии (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Съвети и най-добри практики
- Предпочита stream-базирани APIs за големи файлове и уеб приложения.
- Винаги поставете кодиране върху зареждане и съхранение, за да избегнете мохибака.
- Батч редактира в паметта; ** спести веднъж** за намаляване на I/O.
- Нормализирайте EOL на зареждане, конвертирайте към целенасочено Eol на спестяване.
- Използвайте regex заместване за сложни почиствания в един проход.
- В дълготрайни услуги, мониториране на измерваното използване и да се справят с квотите милосърдно.
FAQ
**Дали TXT запазва таблици, изображения или стилове?**No. TXT е чист текст; усъвършенстваното форматиране е флатентно.
**Мога ли да добавя към съществуващ файл, без да препиша?**Отворете FileStream в режим на допълнение и напишете изхода, който сте спасили. Уверете се, че добавяте предишна новост, ако е необходимо.
**Как да изберем крайната линия?**сет TxtSaveOptions.ParagraphBreak
за "\r\n"
(Windows или "\n"
(УНИКС и МАКОС).
**Как да изключим UTF-8 BOM?**Използване new UTF8Encoding(false)
в TxtSaveOptions.Encoding
.
**Необходим ли е Office или Notepad?**No. Aspose.Words е самостоятелен.