Επεξεργαστής αρχείων κειμένου Aspose.Words για το .NET

Το Aspose.Words Text File Processor για .NET είναι ένα ελαφρύ API που επικεντρώνεται στα σενάρια κειμένου .txt, εκτελέστε προγραμματικές επεξεργασίες (ενσωματώστε, διαγράψτε, αντικαταστήστε) και εξοικονομήστε πίσω στο TXT με ακριβή έλεγχο του κωδικοποίησης , BOM και των τελικών γραμμών – ιδανικό για υπηρεσίες, εργασίες ETL και σωλήνες CI/CD.

Δεν απαιτείται Microsoft Office. Δουλεύει στα Windows, Linux και macOS με το .NET Framework, .Net Core/5/6+, ή Mono.

Εισαγωγή και εγκατάσταση

  • Εγκαταστήστε Aspose.Words από το NuGet.
  • Εφαρμόστε την άδεια σας στο startup (βλέπε Metered Licensing ).
  • Οι απαιτήσεις συστήματος αναθεώρησης περιλαμβάνονται στο Συσκευή εγκατάστασης .

Υποστηριζόμενα σενάρια: ** δρομολόγια αρχείων και ** ροές (συνιστάται για web/cloud).

Γρήγορη έναρξη

Δημιουργία αρχείου TXT (UTF-8, CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

Κατεβάστε ένα TXT με ρητή κωδικοποίηση, προσθέστε κείμενο, αποθηκεύστε ως LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

Χαρακτηριστικά και λειτουργικότητα

Δημιουργία εγγράφων

  • Ξεκινήστε από ένα λευκό έγγραφο κειμένου στη μνήμη.
  • Καθορίστε τη στρατηγική κρυπτογράφησης και EOL κατά την αποθήκευση.
  • Εναλλακτικά, γράψτε το κεφάλαιο / το ποδόσφαιρο ** σχόλια** πριν από το κείμενο σώματος.

Κατεβάστε το υφιστάμενο TXT

  • Κατεβάστε από path , stream ή byte[] με κωδικοποίηση αυτο-αποκαλύψιμο ή με αναγκαστική κώδωση.
  • Διατήρηση ή ομαλοποίηση διακοπών γραμμής (CRLF / ΛΦ / CR) στο φορτίο και / ή την αποθήκευση.
  • Σύνδεση πολύ μεγάλων αρχείων για να διατηρήσετε τη μνήμη σταθερή.

Μανιφέτηση κειμένου

  • Διασχίστε το περιεχόμενο μέσω του συνηθισμένου μοντέλου Document → Section → Paragraph → Run.
  • Εισάγετε, προσθέστε ή διαγράψτε το κείμενο σε ακριβείς τοποθεσίες – χωρίς χειροκίνητη μαθηματική αποζημίωση.
  • Εκτελέστε ** bulk να βρείτε / αντικαταστήσετε** σε όλο το έγγραφο ή διαχωρισμένες γραμμές.
  • Διαχωρίστε / συγχωνεύστε τις παραγράφους από προσαρμοσμένους διαχωριστές.

Εξοικονόμηση στο TXT

  • Αποθηκεύστε στο αρχείο ή stream ** με την επιλεγμένη ** κρυπτογράφηση (UTF‐8 / UDF‐16 / ASCII / κλπ.).
  • Ελέγξτε ρητά τις εκπομπές **BOM ** και ParagraphBreak (EOL.
  • Επαναγραφή ή γράψτε σε μια στοχευμένη ροή που διαχειρίζεστε.

Κωδικοποίηση & i18n

  • Πλήρης υποστήριξη Unicode.
  • Διαφανείς απορρίψεις για σελίδες κώδικα κληρονομιάς κατά την ανάγνωση.
  • Ανακαλύψτε και διατηρήστε Βόμβος Σε φορτίο, εκτός αν υπερβαίνει.

ΠΡΩΤΟ ΑΠΙ

  • Χρήση StreamStream Διαδικτυακές υπηρεσίες και λειτουργίες cloud.
  • Ενεργοποιήστε εύκολα με SDKs S3/Blob και σωλήνες μνήμης.

Performance

  • Το μοντέλο αντικειμένων Lean για το κείμενο.
  • Μειωμένες δραστηριότητες ελαχιστοποιούν τις κατανομές.
  • Thread-safe ανάγνωση; συγχρονισμός γράφει όταν μοιράζεται πόρους.

κοινές συνταγές

1) Regex Find / Replace (συγκέντρωση πολλαπλών χώρων)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 έως UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Ομαλοποίηση των τελών γραμμής (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

Συμβουλές & Καλύτερες Πρακτικές

  • Προτιμά stream-based APIs για μεγάλα αρχεία και web apps.
  • Πάντα ρυθμίστε την κωδικοποίηση στο φορτίο & αποθήκευση για να αποφύγετε το mojibake.
  • Το Batch επεξεργάζεται στη μνήμη. σώσε μία φορά για να μειώσει το I/O.
  • Κανονικοποιήστε το EOL στο φορτίο, μετατρέψτε το σε στοχοθετημένο ΕOL στην αποθήκευση.
  • Χρησιμοποιήστε regex αντικατάσταση για πολύπλοκες καθαρισμούς σε ένα πέρασμα.
  • Σε μακροχρόνιες υπηρεσίες, παρακολουθεί μετρημένη χρήση και χειρίζεται τα ποσοστά με ευγνωμοσύνη.

FAQ

**Το TXT διατηρεί πίνακες, εικόνες ή στυλ?**No. Το TXT είναι απλό κείμενο· η προηγμένη μορφοποίηση είναι πλατφόρμα.

**Μπορώ να προσθέσω σε ένα υπάρχον αρχείο χωρίς υπεργραφή?**Ανοίξτε ένα FileStream στη λειτουργία προσθήκης και γράψτε την αποθηκευμένη έκδοση σε αυτό. Βεβαιωθείτε ότι προσθέτετε μια προηγούμενη νέα γραμμή εάν χρειαστεί.

**Πώς μπορώ να επιλέξω την τελική γραμμή?**ΣΗΜΕΙΩΣΗ TxtSaveOptions.ParagraphBreak Για "\r\n" (Windows ή "\n" (Σύμφωνα με το UNIX και το MACOS).

**Πώς μπορώ να απενεργοποιήσω το UTF-8 BOM?**Χρήση new UTF8Encoding(false) Σε TxtSaveOptions.Encoding.

**Είναι απαραίτητο το Office ή το Notepad?**Όχι.Οι λέξεις είναι ξεχωριστές.

 Ελληνικά