ตัวแยกเอกสาร
The Aspose.Words Document Splitter for .NET ช่วยให้นักพัฒนาสามารถแยกเอกสารการประมวลผลคำออกเป็นไฟล์ขนาดเล็กและจัดการได้ง่าย ไม่ว่าจะเป็นการแยกหน้าแต่ละหน้า การสกัดส่วนเพื่อการตรวจสอบ หรือการประมวลผลเป็นชุดของรายงานขนาดใหญ่ ปลั๊กอินนี้ให้การแยกที่มีประสิทธิภาพสูงและแม่นยำพร้อมคงความสมบูรณ์ของเอกสารทั้งหมด.
การติดตั้งและตั้งค่า
- เพิ่ม Aspose.Words for .NET แพคเกจ NuGet ไปยังโครงการของคุณ ดูที่ คู่มือการติดตั้ง .
- กำหนดค่า Metered Licensing หนึ่งครั้งต่อโดเมนของแอปพลิเคชันเพื่อเปิดใช้งานฟังก์ชันที่ไม่มีลายน้ำ.
สภาพแวดล้อมที่รองรับ:
- OS: Windows, Linux, macOS
- เฟรมเวิร์ก: .NET Framework, .NET Core, Mono
- IDEs: Visual Studio 2017–2026, JetBrains Rider, MonoDevelop.
อินพุต / เอาต์พุตที่รองรับ: DOC, DOCX, RTF, DOT, DOTX, DOTM, DOCM, Word 2003 XML, and Word 2007 XML.
คุณลักษณะและฟังก์ชัน
การสกัดหน้าแบบต่อหน้า
แยกเอกสารเป็นไฟล์แยกตามหน้า ตาราง ภาพ หัวกระดาษ/ท้ายกระดาษ และการจัดรูปแบบที่ซับซ้อนจะถูกคงไว้ แต่ละหน้าจะถูกส่งกลับเป็นอิสระ Document อินสแตนซ์.
using Aspose.Words;
var doc = new Document("BigDocument.docx");
for (int page = 0; page < doc.PageCount; page++)
{
var extractedPage = doc.ExtractPages(page, 1);
extractedPage.Save($"Output_Page_{page + 1}.docx");
}ตัวเลือกการแยกขั้นสูง
แยกไม่เพียงตามหน้าเท่านั้น แต่ยังตาม ส่วน, ที่คั่นหน้า, หรือส่วนหัว/ส่วนท้าย, ให้การควบคุมที่ยืดหยุ่นต่อความละเอียดของผลลัพธ์.
ตัวอย่างโค้ดต่อไปนี้แสดงวิธีการแยกเอกสารตามหัวข้อ:
using Aspose.Words;
var doc = new Document("BigDocument.doc");
var options = new DocSaveOptions
{
// Split a document into smaller parts, in this instance split by heading.
DocumentSplitCriteria = DocumentSplitCriteria.HeadingParagraph
};
doc.Save("SplitDocument.ByHeadings.docx", options);การสตรีมที่ประหยัดหน่วยความจำ
ประมวลผลเอกสารขนาดใหญ่โดยใช้หน่วยความจำน้อยที่สุด เฉพาะเนื้อหาหน้าที่จำเป็นเท่านั้นที่ถูกโหลด ทำให้เหมาะสำหรับแอปพลิเคชันเซิร์ฟเวอร์และกระบวนการทำงานแบบแบตช์.
คอลแบ็กแบบขับเคลื่อนด้วยเหตุการณ์
เชื่อมต่อกับเหตุการณ์ที่ถูกเรียกหลังจากแต่ละหน้า หรือช่วงข้อมูลถูกสกัดออก ใช้คอลแบ็กเพื่อบันทึกความคืบหน้า เก็บผลลัพธ์ชั่วคราว หรือผสานรวมกับไพป์ไลน์ต่อเนื่อง.
โมเดลอ็อบเจกต์ที่สอดคล้องกัน
ใช้แบบคุ้นเคยเดียวกัน Aspose.Words DOM (Document, Section, Paragraph, ฯลฯ), เพื่อให้การบูรณาการกับโค้ดเบสที่มีอยู่เป็นไปอย่างราบรื่น.
การจัดการข้อผิดพลาดและการตรวจสอบความถูกต้อง
ตรวจสอบดัชนีหน้า, รูปแบบอินพุต, และสตรีมล่วงหน้า. ข้อยกเว้นที่ชัดเจน (เช่น,., ArgumentOutOfRangeException) ทำให้การกู้คืนข้อผิดพลาดเป็นเรื่องง่าย.
คุณลักษณะขั้นสูงและประโยชน์
- การประมวลผลแบบชุด: จัดการปริมาณเอกสารจำนวนมากได้อย่างมีประสิทธิภาพ.
- ผลลัพธ์ที่ยืดหยุ่น: บันทึกส่วนที่สกัดออกในรูปแบบที่รองรับใดก็ได้.
- การแก้ไขแบบบูรณาการ: ทำการรวมก่อนหรือหลังการแยกไฟล์.
- ความแม่นยำสูง: การจัดรูปแบบและเค้าโครงของเอกสารต้นฉบับจะถูกเก็บรักษาไว้อย่างสมบูรณ์.
เคล็ดลับและแนวปฏิบัติที่ดีที่สุด
- วางแผนตรรกะการแยกไฟล์: ใช้การแยกตามหน้าเพื่อการควบคุมที่ละเอียด หรือใช้ตัวเลือกการแยกขั้นสูงสำหรับส่วนที่มีตรรกะ.
- ตรวจสอบจำนวนหน้าตลอดก่อนทำการแยกเพื่อหลีกเลี่ยงข้อยกเว้น.
- ใช้ตัวแยกไฟล์ที่ได้รับอนุญาตเพียงหนึ่งอินสแตนซ์ซ้ำทั่วแอปพลิเคชันเพื่อประสิทธิภาพ.
คำถามที่พบบ่อย
- Document Splitter สำหรับ .NET คืออะไร? เครื่องมือเฉพาะที่สร้างบน Aspose.Words เพื่อทำการแยกเอกสารเป็นไฟล์ขนาดเล็กอัตโนมัติ ลดความยุ่งยากในการทำด้วยตนเอง.
- ฉันสามารถแยกตามเกณฑ์อื่นที่ไม่ใช่เลขหน้าได้หรือไม่? ได้เลย คุณสามารถแยกตามส่วน, บุ๊กมาร์ก, ส่วนหัวและส่วนท้าย เพื่อให้การทำงานมีความยืดหยุ่นมากขึ้น.
- เอกสารผลลัพธ์สามารถแก้ไขได้หรือไม่? ใช่. แต่ละไฟล์ที่แยกออกมาคือเอกสาร Word ที่ทำงานเต็มรูปแบบซึ่งคุณสามารถตรวจสอบ, แก้ไข, หรือบันทึกในรูปแบบอื่นได้.
- การแยกส่วนทำให้รูปแบบคงเดิมหรือไม่? แน่นอน. Aspose.Words รับประกันความเที่ยงตรงเต็มรูปแบบต่อรูปแบบต้นฉบับในทุกไฟล์ผลลัพธ์.
- รูปแบบใดบ้างที่รองรับ? DOC, DOCX, RTF, DOT, DOTX, DOTM, DOCM, Word 2003 XML, และ Word 2007 XML.