Aspose.Words ตัวประมวลผลไฟล์ข้อความสำหรับ .NET

Aspose.Words Text File Processor สําหรับ .NET เป็น API ที่น้ําหนักเบาที่มุ่งเน้นไปที่ แบน-text scenarios สร้างไฟล์ข้อความใหม่โหลดที่มีอย .txt, ทําการแก้ไขโปรแกรม (ใส่, ลบ, เปลี่ยน) และ **บันทึกกลับไปยัง TXT ** ด้วยการควบคุมที่แม่นยําเกี่ยวกับ **การเข้ารหัส ** , **BOM ** และ ปลายสาย - เหมาะสําหรับบริการงาน ETL และท่อ CI / CD.

ไม่จําเป็นต้องใช้ Microsoft Office ทํางานบน Windows, Linux และ macOS ด้วย .NET Framework, .Net Core/5/6+, หรือ Mono.

การติดตั้งและการตั้งค่า

สถานการณ์ที่ได้รับการสนับสนุน: ** เส้นทางไฟล์และ ** Streams (แนะนําสําหรับเว็บ/คลาวด).

เริ่มต้นอย่างรวดเร็ว

สร้างไฟล์ TXT (UTF-8 CRLF)

using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;

var doc = new Document();
var builder = new DocumentBuilder(doc);

builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
    ParagraphBreak = "\r\n"                                          // Windows EOL
};

doc.Save("Output.txt", txt);

ดาวน์โหลด TXT ด้วยการเข้ารหัสอ้างอิง, ปรับข้อความ, เก็บเป็น LF

using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;

var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);

var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");

var txt = new TxtSaveOptions
{
    Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
    ParagraphBreak = "\n"                                              // Unix EOL
};

doc.Save("Updated.txt", txt);

คุณสมบัติและฟังก์ชั่น

การสร้างเอกสาร

  • เริ่มต้นจากเอกสารข้อความสีขาวในหน่วยความจํา.
  • การตั้งค่า **การเข้ารหัสแบบกําหนดเอง ** และ EOL หลักการเมื่อบันทึก.
  • ตัวเลือกเขียนหัว / ฟุต ความคิดเห็น ก่อนที่จะเขียนข้อความร่างกาย.

การโหลด TXT ที่มีอย

  • ดาวน์โหลดจาก **path ** , **stream ** หรือ **byte[] ** ด้วย รหัสอัตโนมัติ-การตรวจจับ หรือการเข้ารหัสบังคับ.
  • ป้องกันหรือมาตรฐานเส้นผ่าศูนย์กลาง (CRLF / LF / CR) บนโหลดและ / หรือบันทึก.
  • กระแสไฟล์ขนาดใหญ่มากเพื่อให้หน่วยความจํามั่นคง.

การจัดการข้อความ

  • ผ่านเนื้อหาผ่านรูปแบบที่คุ้นเคย เอกสาร → ส่วน → paragraph → Run.
  • เพิ่มหรือลบข้อความในสถานที่ที่แม่นยํา - ไม่มีการชําระเงินด้วยตนเอง.
  • การดําเนินการ ** Bulk ค้นหา / เปลี่ยน** ทั่วเอกสารทั้งหมดหรือแถวที่สแกน.
  • พารามิเตอร์แบ่ง / ผสมโดย Delimiters แบบกําหนดเอง.

การประหยัดสําหรับ TXT

  • บันทึกไฟล์หรือ stream ด้วยการเข้ารหัสที่เลือก (UTF‐8 / UDF‐16 / ASCII / ฯลฯ.).
  • การควบคุมการส่งออก **BOM ** และ ParagraphBreak (EOL) อย่างชัดเจน.
  • บันทึกหรือเขียนไปยังกระแสเป้าหมายที่คุณจัดการ.

การเข้ารหัส & i18n

  • การสนับสนุนแบบเต็มรูปแบบ UNICODE.
  • ความเสียหายที่โปร่งใสสําหรับหน้ารหัสพันธุกรรมเมื่ออ่าน.
  • การตรวจจับและรักษา บัตร การโหลดโดยไม่เกินไป.

แหล่งจ่ายไฟ APIs

  • ใช StreamStream สําหรับบริการเว็บและฟังก์ชั่น cloud.
  • การบูรณาการได้อย่างง่ายดายกับ SDKs S3/Blob และท่อในหน่วยความจํา.

Performance

  • Lean วัตถุรูปแบบสําหรับข้อความเรียบ.
  • การดําเนินงานที่เรียบง่ายลดค่าใช้จ่าย.
  • ความปลอดภัยในการอ่าน; การซิงค์เขียนเมื่อแบ่งปันทรัพยากร.

สูตรทั่วไป

1) Regex ค้นหา / เปลี่ยน (การเชื่อมต่อพื้นที่หลายแห่ง)

using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;

var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);

doc.Save("cleaned.txt");

2) Stream→Stream (Windows‐1252 ถึง UTF‐8 LF)

using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
    var load = new Aspose.Words.Loading.TxtLoadOptions
    {
        Encoding = Encoding.GetEncoding(1252)
    };
    var doc = new Document(input, load);

    var save = new Aspose.Words.Saving.TxtSaveOptions
    {
        Encoding = new UTF8Encoding(false), // no BOM
        ParagraphBreak = "\n"
    };
    doc.Save(output, save);
}

3) Normalize Line Endings (CRLF → LF)

var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);

เคล็ดลับและปฏิบัติที่ดีที่สุด

  • ปพลิเคชัน APIs สําหรับไฟล์ขนาดใหญ่และแอปเว็บ.
  • เสมอตั้งค่าการเข้ารหัส บนโหลดและบันทึกเพื่อหลีกเลี่ยง mojibake.
  • การแก้ไขแบตช์ในหน่วยความจํา บันทึกครั้งเดียว เพื่อลด I / O.
  • มาตรฐาน EOL บนโหลด, แปลงไปยังเป้าหมาย Eol บนบันทึก.
  • ใช้ regex เปลี่ยน สําหรับการทําความสะอาดที่ซับซ้อนในครั้งเดียว.
  • ในบริการระยะยาวตรวจสอบการใช้งานที่วัดและจัดการปริมาณด้วยความสุข.

FAQ

**TXT เก็บตารางรูปภาพหรือรูปแบบหรือไม?**No. TXT เป็นข้อความที่เรียบ; การจัดรูปแบบขั้นสูงจะถูกกรอก.

**ฉันสามารถเชื่อมต่อกับไฟล์ที่มีอยู่โดยไม่ต้องเขียนเกินไปได้หรือไม?**Open a FileStream in append mode and write the saved output to it. ให้แน่ใจว่าคุณเพิ่ม newline ก่อนหน้านี้ถ้าจําเป็น.

**ฉันจะเลือกเส้นที่สิ้นสุดได้อย่างไร?**ชุด TxtSaveOptions.ParagraphBreak ไปยัง "\r\n" (Windows) หรือ "\n" (UNIX / MACOS).

**ฉันจะปิดการใช้งาน UTF-8 BOM ได้อย่างไร?**ใช new UTF8Encoding(false) ใน TxtSaveOptions.Encoding.

**ต้องใช้ Office หรือ Notepad?**No. Aspose.Words เป็นสแตนเลส.

 แบบไทย