Aspose.Words ตัวประมวลผลไฟล์ข้อความสำหรับ .NET
Aspose.Words Text File Processor สําหรับ .NET เป็น API ที่น้ําหนักเบาที่มุ่งเน้นไปที่ แบน-text scenarios สร้างไฟล์ข้อความใหม่โหลดที่มีอย .txt
, ทําการแก้ไขโปรแกรม (ใส่, ลบ, เปลี่ยน) และ **บันทึกกลับไปยัง TXT ** ด้วยการควบคุมที่แม่นยําเกี่ยวกับ **การเข้ารหัส ** , **BOM ** และ ปลายสาย - เหมาะสําหรับบริการงาน ETL และท่อ CI / CD.
ไม่จําเป็นต้องใช้ Microsoft Office ทํางานบน Windows, Linux และ macOS ด้วย .NET Framework, .Net Core/5/6+, หรือ Mono.
การติดตั้งและการตั้งค่า
- ติดตั้ง Aspose.Words จาก NuGet.
- ใบอนุญาตของคุณที่เริ่มต้น (ดู Metered Licensing ).
- ข้อกําหนดของระบบตรวจสอบใน ** คู่มือการติดตั้ง **.
สถานการณ์ที่ได้รับการสนับสนุน: ** เส้นทางไฟล์และ ** Streams (แนะนําสําหรับเว็บ/คลาวด).
เริ่มต้นอย่างรวดเร็ว
สร้างไฟล์ TXT (UTF-8 CRLF)
using Aspose.Words;
using Aspose.Words.Saving;
using System.Text;
var doc = new Document();
var builder = new DocumentBuilder(doc);
builder.Writeln("Paragraph 1.");
builder.Writeln("Paragraph 2.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: true), // with BOM
ParagraphBreak = "\r\n" // Windows EOL
};
doc.Save("Output.txt", txt);
ดาวน์โหลด TXT ด้วยการเข้ารหัสอ้างอิง, ปรับข้อความ, เก็บเป็น LF
using Aspose.Words;
using Aspose.Words.Loading;
using Aspose.Words.Saving;
using System.Text;
var load = new TxtLoadOptions { Encoding = Encoding.UTF8 };
var doc = new Document("Input.txt", load);
var builder = new DocumentBuilder(doc);
builder.MoveToDocumentEnd();
builder.Writeln("");
builder.Writeln("Appended by Aspose.Words.");
var txt = new TxtSaveOptions
{
Encoding = new UTF8Encoding(encoderShouldEmitUTF8Identifier: false), // UTF‑8 no BOM
ParagraphBreak = "\n" // Unix EOL
};
doc.Save("Updated.txt", txt);
คุณสมบัติและฟังก์ชั่น
การสร้างเอกสาร
- เริ่มต้นจากเอกสารข้อความสีขาวในหน่วยความจํา.
- การตั้งค่า **การเข้ารหัสแบบกําหนดเอง ** และ EOL หลักการเมื่อบันทึก.
- ตัวเลือกเขียนหัว / ฟุต ความคิดเห็น ก่อนที่จะเขียนข้อความร่างกาย.
การโหลด TXT ที่มีอย
- ดาวน์โหลดจาก **path ** , **stream ** หรือ **byte[] ** ด้วย รหัสอัตโนมัติ-การตรวจจับ หรือการเข้ารหัสบังคับ.
- ป้องกันหรือมาตรฐานเส้นผ่าศูนย์กลาง (CRLF / LF / CR) บนโหลดและ / หรือบันทึก.
- กระแสไฟล์ขนาดใหญ่มากเพื่อให้หน่วยความจํามั่นคง.
การจัดการข้อความ
- ผ่านเนื้อหาผ่านรูปแบบที่คุ้นเคย เอกสาร → ส่วน → paragraph → Run.
- เพิ่มหรือลบข้อความในสถานที่ที่แม่นยํา - ไม่มีการชําระเงินด้วยตนเอง.
- การดําเนินการ ** Bulk ค้นหา / เปลี่ยน** ทั่วเอกสารทั้งหมดหรือแถวที่สแกน.
- พารามิเตอร์แบ่ง / ผสมโดย Delimiters แบบกําหนดเอง.
การประหยัดสําหรับ TXT
- บันทึกไฟล์หรือ stream ด้วยการเข้ารหัสที่เลือก (UTF‐8 / UDF‐16 / ASCII / ฯลฯ.).
- การควบคุมการส่งออก **BOM ** และ ParagraphBreak (EOL) อย่างชัดเจน.
- บันทึกหรือเขียนไปยังกระแสเป้าหมายที่คุณจัดการ.
การเข้ารหัส & i18n
- การสนับสนุนแบบเต็มรูปแบบ UNICODE.
- ความเสียหายที่โปร่งใสสําหรับหน้ารหัสพันธุกรรมเมื่ออ่าน.
- การตรวจจับและรักษา บัตร การโหลดโดยไม่เกินไป.
แหล่งจ่ายไฟ APIs
- ใช
Stream
→Stream
สําหรับบริการเว็บและฟังก์ชั่น cloud. - การบูรณาการได้อย่างง่ายดายกับ SDKs S3/Blob และท่อในหน่วยความจํา.
Performance
- Lean วัตถุรูปแบบสําหรับข้อความเรียบ.
- การดําเนินงานที่เรียบง่ายลดค่าใช้จ่าย.
- ความปลอดภัยในการอ่าน; การซิงค์เขียนเมื่อแบ่งปันทรัพยากร.
สูตรทั่วไป
1) Regex ค้นหา / เปลี่ยน (การเชื่อมต่อพื้นที่หลายแห่ง)
using System.Text.RegularExpressions;
using Aspose.Words;
using Aspose.Words.Replacing;
var doc = new Document("input.txt");
var opts = new FindReplaceOptions { MatchCase = false };
doc.Range.Replace(new Regex(@"\s{2,}"), " ", opts);
doc.Save("cleaned.txt");
2) Stream→Stream (Windows‐1252 ถึง UTF‐8 LF)
using (var input = File.OpenRead("legacy.txt"))
using (var output = File.Create("normalized.txt"))
{
var load = new Aspose.Words.Loading.TxtLoadOptions
{
Encoding = Encoding.GetEncoding(1252)
};
var doc = new Document(input, load);
var save = new Aspose.Words.Saving.TxtSaveOptions
{
Encoding = new UTF8Encoding(false), // no BOM
ParagraphBreak = "\n"
};
doc.Save(output, save);
}
3) Normalize Line Endings (CRLF → LF)
var d = new Document("crlf.txt");
var save = new Aspose.Words.Saving.TxtSaveOptions { ParagraphBreak = "\n" };
d.Save("lf.txt", save);
เคล็ดลับและปฏิบัติที่ดีที่สุด
- ปพลิเคชัน APIs สําหรับไฟล์ขนาดใหญ่และแอปเว็บ.
- เสมอตั้งค่าการเข้ารหัส บนโหลดและบันทึกเพื่อหลีกเลี่ยง mojibake.
- การแก้ไขแบตช์ในหน่วยความจํา บันทึกครั้งเดียว เพื่อลด I / O.
- มาตรฐาน EOL บนโหลด, แปลงไปยังเป้าหมาย Eol บนบันทึก.
- ใช้ regex เปลี่ยน สําหรับการทําความสะอาดที่ซับซ้อนในครั้งเดียว.
- ในบริการระยะยาวตรวจสอบการใช้งานที่วัดและจัดการปริมาณด้วยความสุข.
FAQ
**TXT เก็บตารางรูปภาพหรือรูปแบบหรือไม?**No. TXT เป็นข้อความที่เรียบ; การจัดรูปแบบขั้นสูงจะถูกกรอก.
**ฉันสามารถเชื่อมต่อกับไฟล์ที่มีอยู่โดยไม่ต้องเขียนเกินไปได้หรือไม?**Open a FileStream in append mode and write the saved output to it. ให้แน่ใจว่าคุณเพิ่ม newline ก่อนหน้านี้ถ้าจําเป็น.
**ฉันจะเลือกเส้นที่สิ้นสุดได้อย่างไร?**ชุด TxtSaveOptions.ParagraphBreak
ไปยัง "\r\n"
(Windows) หรือ "\n"
(UNIX / MACOS).
**ฉันจะปิดการใช้งาน UTF-8 BOM ได้อย่างไร?**ใช new UTF8Encoding(false)
ใน TxtSaveOptions.Encoding
.
**ต้องใช้ Office หรือ Notepad?**No. Aspose.Words เป็นสแตนเลส.