Aspose.Words szöveg fájl feldolgozó .NET
A Aspose.Words Text File Processor for .NET egy könnyű API, amely aplain-text forgatókönyvekre összpontosít .txt
, programozási szerkesztéseket végez (beállítása, törlése, cseréje), és támogatás a TXT pontosan ellenőrizhető kódolás , BOM ésvonal befejezések – ideális szolgáltatások, ETL munkák és CI/CD csővezetékek.
A Windows, a Linux és a macOS rendszerek a .NET Framework, .Net Core/5/6+ vagy Mono rendszerrel működnek.
Telepítés és telepítés
- Telepítse Aspose.Words a NuGet-ről.
- Jelölje be a licencét a startupnál (lásd Metered Licensing ).
- A rendszer követelményeinek felülvizsgálata a Installation Guide .
Támogatott forgatókönyvek: ** fájlútvonalak és ** áramlások (web / felhőre ajánlott).
Gyors indulás
TXT fájl létrehozása (UTF‐8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Töltse le a TXT-t kifejezett kódolással, adja meg a szöveget, mentse úgy, mint LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Jellemzők és funkcionalitás
Dokumentum létrehozása
- Kezdjük a memóriában lévő fehér szöveges dokumentummal.
- Állítsa be a **default kódolás ** és EOL stratégiát a megtakarítás során.
- Opcionálisan írja be a címet/folyamatot kommentációk a test szöveg előtt.
Meglévő TXT feltöltés
- Töltse le a path , stream vagy byte[] -ról az autodetektus kódolásával vagy kényszer kódolással.
- Megőrzése vagy normalizálása vonalszakadások (CRLF / LF / CR) terhelés és / vagy mentés.
- Nagyon nagy fájlok áramlása, hogy a memória stabil maradjon.
A szöveg manipulációja
- A tartalmat az ismerős Document → Section → Paragraph → Run modellt használja.
- Írja be, bővítse vagy törölje a szöveget pontos helyeken – nincs kézi kedvezmény matematika.
- Végezze el ** bulk megtalálni / helyettesíteni** az egész dokumentumon vagy feloldott sorokon.
- Szétválasztja / keverje a bekezdéseket a szokásos delimitátorok által.
Megtakarítás TXT
- Mentse a fájlra vagy stream ** a kiválasztott ** kódolással (UTF‐8/UTP‐16/ASCII/ stb.).
- Ellenőrizze a **BOM ** kibocsátást és ParagraphBreak (EOL) kifejezetten.
- Írja át vagy írjon egy céláramra, amelyet kezel.
Kódolás & i18n
- Teljes ** Unicode** támogatás.
- Átlátszó hátrányok az öröklési kód oldalakhoz az olvasás során.
- Felfedezése és megőrzése bombák a terhelés, kivéve, ha túlterhelik.
Áram-első APIs
- Használat
Stream
→Stream
Webes szolgáltatások és felhőfunkciók. - Könnyen integrálható az S3/Blob SDK-kkal és a memóriában lévő csővezetékekkel.
Performance
- Lean objektum modellek a tiszta szöveghez.
- A könnyű műveletek minimalizálják az elosztásokat.
- Thread-safe olvasás; szinkronizálja az írás, amikor megosztja az erőforrásokat.
Közös receptek
Regex Find / Replace (több tér összeolvadása)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 a UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalization Line Endings (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Tippek és legjobb gyakorlatok
- Előnyben részesíti a stream-alapú API-kat a nagy fájlokhoz és webes alkalmazásokhoz.
- Mindig beállítsa a kódolást a terhelésre és mentésre, hogy elkerüljék a mojibake-t.
- Batch szerkesztés a memóriában; megtakarítson egyszer az I/O csökkentése érdekében.
- Normalizálja az EOL-t a terhelésen, átalakítsa a célba a megtakarítással.
- Használja regex cseréje a komplex tisztítások egy útvonalon.
- Hosszú távú szolgáltatásokban figyelemmel kíséri a mérsékelt használatot és kedvesen kezeli a kvótákat.
FAQ
**A TXT megőrzi a táblákat, képeket vagy stílusokat?**No. A TXT egy tiszta szöveg; a fejlett formázás elterjedt.
**Megközelíthetek egy meglévő fájlt anélkül, hogy túlírom?**Nyissa meg a FileStream kiegészítő módban, és írja be a mentett kimenetet.
**Hogyan válasszuk ki a végvonalat?**Összetétel TxtSaveOptions.ParagraphBreak
hogy "\r\n"
(Windows vagy "\n"
(Az Unix és a MacOS).
**Hogyan lehet kikapcsolni az UTF‐8 BOM-t?**Használat new UTF8Encoding(false)
A TxtSaveOptions.Encoding
.
**Office vagy Notepad++ szükséges?**Nem. Az ASPOSE.Words állandó.