Aspose.Words tekstitiedostojen käsittelijä .NET
Aspose.Words Text File Processor for .NET on kevyt API, joka keskittyy plain-tekstin skenaarioihin . Luo uusia tekstitiedostoja, ladata olemassa olevia .txt
, suorittaa ohjelmattisia muokkauksia (sisältää, poistaa, korvata) ja palauta takaisin TXT tarkalla hallinnalla kooditusta , BOM jalinjan päättymistä – ihanteellinen palveluille, ETL-työpaikoille ja CI/CD-putkeille.
Toimi Windowsissa, Linuxissa ja macOS:ssa .NET Framework, .Net Core/5/6+, tai Mono.
Asennus ja asennus
- Asenna Aspose.Words kohteesta NuGet.
- Hanki lisenssi startupissa (katso Metered Licensing ).
- Tarkista järjestelmän vaatimukset Installation Guide .
**Tuetut skenaarioita: ** tiedostomenetelmät ja virrat (suositeltu web / pilvelle).
Nopea aloitus
Luo TXT-tiedosto (UTF-8 ja CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Lataa TXT nimenomaisella koodauksella, lisätä tekstiä, tallentaa LF:ksi
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Ominaisuudet ja toiminnallisuus
Dokumentti luominen
- Aloita valkoisesta tekstin asiakirjasta muistiin.
- Aseta **default koodaus ** ja EOL strategia säästettäessä.
- Vaihtoehtoisesti kirjoita header/footer ** kommentit** ennen kehon tekstiä.
Lataa olemassa oleva TXT
- Lataa path , stream tai byte[] automaattisen tunnistuksen tai pakollisen koodauksen avulla.
- Suojaa tai normalisoida linjan murteet (CRLF / LF / CR) kuormituksella ja / tai säästämällä.
- Virtaa hyvin suuria tiedostoja, jotta muisti pysyy vakaana.
Tekstin manipulointi
- Siirry sisällön kautta tutun Document → Section → Paragraph → Run -mallin kautta.
- Sisällytä, liitä tai poista teksti tarkissa paikoissa – ei manuaalista matemaattista korvausta.
- Toimi bulk löytää / korvaa koko asiakirjan tai purettuja sarjoja.
- jakaa / sekoittaa kappaleita tavanomaisilla määrittäjillä.
Säästää TXT
- Tallenna tiedostoon tai **virta ** valitulla koodilla (UTF‐8/UTP‐16/ASCII/etc.).
- Hallitse **BOM ** päästöjä ja ParagraphBreak (EOL) selkeästi.
- Kirjoita uudelleen tai kirjoita kohteeseen, jonka hallitset.
Lataa & i18n
- Täydellinen ** Unicode** tuki.
- Läpinäkyvä palautuminen perintökoodin sivuille lukemisen aikana.
- Tunnistaa ja säilyttää pommi kuormituksessa, ellei se ole liioiteltu.
Ensimmäinen APIs
- Käytä
Stream
→Stream
Web-palvelut ja pilvipalvelut. - Integroidaan helposti S3/Blob SDK:n ja muistin putkien kanssa.
Performance
- Lean-objekti malli suorat tekstit.
- Hyvät toiminnot vähentävät määrärahoja.
- Thread-safe lukeminen; synkronointi kirjoittaa jaettaessa resursseja.
Yleisiä reseptejä
1) Regex Löydä / Vaihda (kollapsi useita tiloja)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 to UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalize Line Endings (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Vinkkejä ja parhaita käytäntöjä
- Mieluummin stream-pohjaiset APIs suurille tiedostoille ja web-sovelluksille.
- Aina asettaa koodaus lataukseen ja tallennukseen, jotta vältetään mojibake.
- Batch muuttaa muistiin; ** säästää kerran** vähentää I/O:ta.
- Normalisoida EOL kuormituksella, kääntää kohderyhmään.
- Käytä regex korvaa monimutkaisiin puhdistuksiin yhdessä passissa.
- Pitkäaikaisissa palveluissa tarkkaile mitattua käyttöä ja käsittele kvottia ystävällisesti.
FAQ
**Onko TXT säilyttänyt taulukoita, kuvia tai tyylejä?**No. TXT on tasainen teksti; edistyksellinen muotoilu on täynnä.
**Voinko liittää olemassa olevaan tiedostoon ilman liioittelua?**Avaa FileStream lisämuodossa ja kirjoita siihen tallennettu tulos. Varmista, että lisääte edellisen uutinen tarvittaessa.
**Miten voin valita lopullisen linjan?**Setissä TxtSaveOptions.ParagraphBreak
että "\r\n"
(Windowsin tai "\n"
(Yhdistelmä ja macOS).
**Miten estän UTF-8 BOM:n?**Käytä new UTF8Encoding(false)
Sisään TxtSaveOptions.Encoding
.
**Onko Office tai Notepad ++ tarpeen?**No. Aspose.Words on erillinen.