Επεξεργαστής αρχείων κειμένου Aspose.Words για το .NET
Το Aspose.Words Text File Processor για .NET είναι ένα ελαφρύ API που επικεντρώνεται στα σενάρια κειμένου .txt
, εκτελέστε προγραμματικές επεξεργασίες (ενσωματώστε, διαγράψτε, αντικαταστήστε) και εξοικονομήστε πίσω στο TXT με ακριβή έλεγχο του κωδικοποίησης , BOM και των τελικών γραμμών – ιδανικό για υπηρεσίες, εργασίες ETL και σωλήνες CI/CD.
Δεν απαιτείται Microsoft Office. Δουλεύει στα Windows, Linux και macOS με το .NET Framework, .Net Core/5/6+, ή Mono.
Εισαγωγή και εγκατάσταση
- Εγκαταστήστε Aspose.Words από το NuGet.
- Εφαρμόστε την άδεια σας στο startup (βλέπε Metered Licensing ).
- Οι απαιτήσεις συστήματος αναθεώρησης περιλαμβάνονται στο Συσκευή εγκατάστασης .
Υποστηριζόμενα σενάρια: ** δρομολόγια αρχείων και ** ροές (συνιστάται για web/cloud).
Γρήγορη έναρξη
Δημιουργία αρχείου TXT (UTF-8, CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
Κατεβάστε ένα TXT με ρητή κωδικοποίηση, προσθέστε κείμενο, αποθηκεύστε ως LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
Χαρακτηριστικά και λειτουργικότητα
Δημιουργία εγγράφων
- Ξεκινήστε από ένα λευκό έγγραφο κειμένου στη μνήμη.
- Καθορίστε τη στρατηγική κρυπτογράφησης και EOL κατά την αποθήκευση.
- Εναλλακτικά, γράψτε το κεφάλαιο / το ποδόσφαιρο ** σχόλια** πριν από το κείμενο σώματος.
Κατεβάστε το υφιστάμενο TXT
- Κατεβάστε από path , stream ή byte[] με κωδικοποίηση αυτο-αποκαλύψιμο ή με αναγκαστική κώδωση.
- Διατήρηση ή ομαλοποίηση διακοπών γραμμής (CRLF / ΛΦ / CR) στο φορτίο και / ή την αποθήκευση.
- Σύνδεση πολύ μεγάλων αρχείων για να διατηρήσετε τη μνήμη σταθερή.
Μανιφέτηση κειμένου
- Διασχίστε το περιεχόμενο μέσω του συνηθισμένου μοντέλου Document → Section → Paragraph → Run.
- Εισάγετε, προσθέστε ή διαγράψτε το κείμενο σε ακριβείς τοποθεσίες – χωρίς χειροκίνητη μαθηματική αποζημίωση.
- Εκτελέστε ** bulk να βρείτε / αντικαταστήσετε** σε όλο το έγγραφο ή διαχωρισμένες γραμμές.
- Διαχωρίστε / συγχωνεύστε τις παραγράφους από προσαρμοσμένους διαχωριστές.
Εξοικονόμηση στο TXT
- Αποθηκεύστε στο αρχείο ή stream ** με την επιλεγμένη ** κρυπτογράφηση (UTF‐8 / UDF‐16 / ASCII / κλπ.).
- Ελέγξτε ρητά τις εκπομπές **BOM ** και ParagraphBreak (EOL.
- Επαναγραφή ή γράψτε σε μια στοχευμένη ροή που διαχειρίζεστε.
Κωδικοποίηση & i18n
- Πλήρης υποστήριξη Unicode.
- Διαφανείς απορρίψεις για σελίδες κώδικα κληρονομιάς κατά την ανάγνωση.
- Ανακαλύψτε και διατηρήστε Βόμβος Σε φορτίο, εκτός αν υπερβαίνει.
ΠΡΩΤΟ ΑΠΙ
- Χρήση
Stream
→Stream
Διαδικτυακές υπηρεσίες και λειτουργίες cloud. - Ενεργοποιήστε εύκολα με SDKs S3/Blob και σωλήνες μνήμης.
Performance
- Το μοντέλο αντικειμένων Lean για το κείμενο.
- Μειωμένες δραστηριότητες ελαχιστοποιούν τις κατανομές.
- Thread-safe ανάγνωση; συγχρονισμός γράφει όταν μοιράζεται πόρους.
κοινές συνταγές
1) Regex Find / Replace (συγκέντρωση πολλαπλών χώρων)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 έως UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Ομαλοποίηση των τελών γραμμής (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
Συμβουλές & Καλύτερες Πρακτικές
- Προτιμά stream-based APIs για μεγάλα αρχεία και web apps.
- Πάντα ρυθμίστε την κωδικοποίηση στο φορτίο & αποθήκευση για να αποφύγετε το mojibake.
- Το Batch επεξεργάζεται στη μνήμη. σώσε μία φορά για να μειώσει το I/O.
- Κανονικοποιήστε το EOL στο φορτίο, μετατρέψτε το σε στοχοθετημένο ΕOL στην αποθήκευση.
- Χρησιμοποιήστε regex αντικατάσταση για πολύπλοκες καθαρισμούς σε ένα πέρασμα.
- Σε μακροχρόνιες υπηρεσίες, παρακολουθεί μετρημένη χρήση και χειρίζεται τα ποσοστά με ευγνωμοσύνη.
FAQ
**Το TXT διατηρεί πίνακες, εικόνες ή στυλ?**No. Το TXT είναι απλό κείμενο· η προηγμένη μορφοποίηση είναι πλατφόρμα.
**Μπορώ να προσθέσω σε ένα υπάρχον αρχείο χωρίς υπεργραφή?**Ανοίξτε ένα FileStream στη λειτουργία προσθήκης και γράψτε την αποθηκευμένη έκδοση σε αυτό. Βεβαιωθείτε ότι προσθέτετε μια προηγούμενη νέα γραμμή εάν χρειαστεί.
**Πώς μπορώ να επιλέξω την τελική γραμμή?**ΣΗΜΕΙΩΣΗ TxtSaveOptions.ParagraphBreak
Για "\r\n"
(Windows ή "\n"
(Σύμφωνα με το UNIX και το MACOS).
**Πώς μπορώ να απενεργοποιήσω το UTF-8 BOM?**Χρήση new UTF8Encoding(false)
Σε TxtSaveOptions.Encoding
.
**Είναι απαραίτητο το Office ή το Notepad?**Όχι.Οι λέξεις είναι ξεχωριστές.