Aspose.Words teksta failu apstrādātājs .NET
Aspose.Words teksta failu apstrādātājs .NET ir viegls API, kas koncentrējas uz plain-text scenārijiem .txt
, veikti programmatiskie rediģējumi (pievieno, dzēš, aizstāj), un save atpakaļ uz TXT ar precīzu kontroli par kodēšanu, BOM un line beigas - ideāli piemēroti pakalpojumiem, ETL darbiem un CI/CD caurulēm.
Microsoft Office nav nepieciešams. darbojas Windows, Linux un macOS ar .NET Framework, .Net Core/5/6+, vai Mono.
Instalācija un uzstādīšana
- Instalēt Aspose.Words no NuGet.
- Pieteikties licencē start-up (skatīt Metered Licensing ).
- Pārskata sistēmas prasības Installation Guide .
Atbalstītie scenāriji: failu maršruti un strēmi (rekomendēti tīmekļa / mākoņa lietotājiem).
Ātrs sākums
TXT faila izveide (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Lejupielādēt TXT ar skaidru kodēšanu, pievienot tekstu, saglabāt kā LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Iezīmes un funkcionalitāte
Dokumentu radīšana
- Sāciet ar baltu teksta dokumentu atmiņā.
- Iestatīt default kodēšanas un EOL stratēģiju ietaupīšanas laikā.
- Ieteicams rakstīt virsrakstu / pēdas ** komentārus** pirms ķermeņa teksta.
Lietojot esošo TXT
- Lejupielādēt no path, stream vai byte[] ar kodu auto-detektu un piespiedu kodēšanu.
- Saglabāt vai normalizēt līnijas pārtraukumus (CRLF / LF / CR) uz slodzes un / vai ietaupīt.
- Pārsūtīt ļoti lielas failus, lai saglabātu atmiņu stabilu.
Teksta manipulācija
- Pārslēdziet saturu, izmantojot pazīstamo Dokuments → Sekcija → Paraksts → Run modeli.
- Ievadiet, piestipriniet vai izdzēstiet tekstu precīzās vietās – nav manuālās atlaides matemātikas.
- Izveidojiet ** bulk atrast / aizstāt** visā dokumentā vai izslēgto rangu.
- sadalīt / apvienot punktus ar personalizētiem delimitoriem.
Ieguldījums TXT
- Iegūstiet failu vai stream ar izvēlēto kodēšanu (UTF‐8/UTP‐16/ASCII/etc.).
- Kontrolēt BOM emisijas un ParagraphBreak (EOL) skaidri.
- Pārrakstīt vai rakstīt uz mērķa plūsmu, ko pārvaldāt.
Iepakojums & i18n
- Pilna ** Unicode** atbalsts.
- Pārredzamas atgriešanās mantojuma kodu lapām lasīšanas laikā.
- Atzīt un saglabāt Bomba uz slodzes, ja vien nav pārspīlēts.
Stream-Pirms APIs
- Use
Stream
→Stream
tīmekļa pakalpojumiem un mākoņu funkcijām. - Vienkārši integrējiet ar S3/Blob SDK un atmiņas caurulēm.
Performance
- Lean objekta modelis plašam tekstam.
- Lāzās operācijas samazina piešķīrumus.
- Thread-safe lasīšana; sinhronizācija raksta, dalot resursus.
Kopīgas receptes
1) Regex atrast / aizstāt (collapse vairāku telpu)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 uz UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalizēt līnijas beigas (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Tips & Labākās prakses
- Prefer stream-based API lieliem failiem un tīmekļa lietojumiem.
- Vienmēr iestatīt kodēšanu uz slodzi un saglabāt, lai izvairītos no mojibake.
- Batch rediģē atmiņā; ** glabā vienu reizi**, lai samazinātu I/O.
- Normalizēt EOL uz slodzes, konvertēt uz mērķtiecīgu Eol uz ietaupījumu.
- Izmantojiet regex aizstāj sarežģītu tīrīšanu vienā pasē.
- Ilgtermiņa pakalpojumos uzrauga mērītu lietošanu un labprāt pārvalda kvotu.
FAQ
**Vai TXT saglabā tabulas, attēlus vai stili?**TXT ir plašs teksts; paplašināts formāts ir plātināts.
**Vai es varu pievienot esošo failu bez pārrakstīšanas?**Atvērt FileStream pielikuma režīmā un uzrakstīt ietaupīto iznākumu.
**Kā es varu izvēlēties līniju beigas?**Set TxtSaveOptions.ParagraphBreak
Lai "\r\n"
(Windows vai "\n"
(Un tas ir UNIX / MACOS).
**Kā es izslēdzu UTF-8 BOM?**Use new UTF8Encoding(false)
Iekšējā TxtSaveOptions.Encoding
.
**Vai ir nepieciešams Office vai Notepad?**No Aspose.Words ir standalone.