รูปแบบไฟล์ TAR
ทบทวน
ไฟล์ TAR ซึ่งเป็น Tape ARchive เป็นสิ่งสําคัญในโลกของการจัดการไฟล์โดยเฉพาะอย่างยิ่งบนระบบที่ใช้ Unix ก่อตั้งขึ้นในปี 1979 โดย AT&T Bell Laboratories, TAR files serve as a simple but powerful mechanism to bundle multiple files and directories into a single archive without compression. รูปแบบนี้ถูกใช้กันอย่างแพร่หลายทั่วระบบปฏิบัติการต่างๆเนื่องจากความเรียบง่ายและความเข้ากันได้. ไม่ว่าคุณเป็นนักพัฒนาที่กําลังมองหารหัสแหล่งกําเนิดแพคเกจหรือผู้จัดการระบบจัดการ backups, การเข้าใจของ ins และ outs ของ file TAR สามารถปรับปรุงการทํางานของคุณอย่างมาก.
คุณสมบัติสำคัญ
- การจัดเก็บที่ไม่บีบอัด: TAR archives data in an uncompressed form, making them ideal for quick file transfers without worrying about compression overhead.
- ข้อมูล Metadata รายละเอียด: ไฟล์แต่ละไฟล์ในไฟล์ TAR รวมถึงข้อมูล metadata เช่นเวลาสถิติข้อมูลการเป็นเจ้าของและอนุญาตเพื่อให้แน่ใจว่าเนื้อหาเดิมของไฟล์ใด ๆ จะถูกเก็บไว.
- การเข้ากันได้ระหว่างแพลตฟอร์ม: แม้ว่าจะมีรากในระบบ Unix ไฟล์ TAR ได้รับการสนับสนุนโดยระบบปฏิบัติการที่ทันสมัยมากที่สุดทําให้พวกเขามีความหลากหลายสําหรับสภาพแวดล้อมที่แตกต่างกัน.
- รูปแบบที่กําหนดเอง: รูปแบบนี้จะปฏิบัติตามมาตรฐาน POSIX (POSIX.1-1988 และภายหลัง POSix.1-2001) เพื่อให้มั่นใจได้ว่าการดําเนินการต่างๆมีความสม่ําเสมอ.
- End-of-File Marker: ไฟล์ TAR ประกอบด้วยเครื่องหมายปลายไฟล์สองบล็อกซึ่งช่วยในการระบุจุดสิ้นสุดของไฟล.
ข้อมูลจําเพาะทางเทคนิค
โครงสร้างรูปแบบ
TAR เป็นรูปแบบที่ขึ้นอยู่กับข้อความที่จัดระเบียบข้อมูลเป็นบล็อกขนาด 512 บิต แต่ละบล็อคสามารถแสดงทั้งหัวหรือเนื้อหาไฟล์ ความขาดหมายเลขมหัศจรรย์ทําให้มันแตกต่างจากรูปแบบอื่น ๆ เช่น ZIP ที่ตัวระบุเฉพาะจะถูกใช้เพื่อรับรู้ประเภท archive.
ส่วนประกอบหลัก
- Header Block: ประกอบด้วยข้อมูลโลหะเกี่ยวกับไฟล์แต่ละไฟล์เช่นชื่อโหมด ID ผู้ใช้ ID กลุ่ม ID ขนาด และเวลา.
- บล็อกเนื้อหาไฟล์: ติดตามบล็อกหัวและมีข้อมูลไฟล์ที่แท้จริง ปล็อคเหล่านี้สามารถแบ่งออกเป็นหน่วยขนาดใหญ่เพื่อดําเนินการ I/O ที่มีประสิทธิภาพ (blocking).
- End-of-File Marker: ประกอบด้วยสองบล็อก 512 บิตที่เต็มไปด้วยศูนย์ไบนารีเพื่อหมายถึงจุดสิ้นสุดของไฟล.
มาตรฐาน & ความสอดคล้อง
TAR เอดคล้องกับมาตรฐาน POSIX เพื่อให้แน่ใจว่าการเข้ากันได้ระหว่างระบบและเวอร์ชันที่แตกต่างกัน ในขณะที่มันไม่ได้สนับสนุนการบีบอัดตามธรรมชาติการขยายต่างๆเช่น .tar.gz
(gzip) หรือ .tar.bz2
(bzip2) ใช้กันอย่างแพร่หลายสําหรับไฟล์ TAR ที่บีบอัด.
ประวัติศาสตร์ & การพัฒนา
- 1979: แนะนําครั้งแรกโดย AT&T Bell Laboratories.
- POSIX.1-1988 และ POSIX1-2001: มาตรฐานได้รับการตั้งค่าเพื่อมาตรฐานรูปแบบเพื่อให้แน่ใจว่ามีการปฏิบัติตามการต่างๆ.
- GNU Tar: รุ่นที่เพิ่มขึ้นพร้อมคุณสมบัติเพิ่มเติมเช่นการขยาย pax เพื่อความเข้ากันได้ที่ดีขึ้น.
การทํางานกับ TAR ไฟล
เปิดไฟล์ TAR
เพื่อเปิดไฟล์ TAR:
- Windows: ติดตั้ง 7-Zip หรือใช้ Windows Subsystem สําหรับ Linux (WSL).
- Mac: คลิกสองครั้งไฟล์เพื่อสกัด.
- Linux: ใช
tar -xvf
คู่มือในเทอร์มินัล.
การแปลงไฟล์ TAR
การแปลงทั่วไปรวมถึงการบีบอัดไฟล์ TAR ใน .tar.gz
, .tar.bz2
, ฯลฯ ตัวอย่างเช่นการแปลงไฟล์ TAR แบบเรียบเป็นไฟล์ที่บีบอัดด้วย gzip สามารถทําได้โดย:
tar -czf archive.tar.gz directory/
สร้างไฟล์ TAR
เพื่อสร้างไฟล์ TAR ใหม่บนระบบ Linux หรือ Unix:
tar -cvf archive.tar /path/to/directory
ใน Windows คุณสามารถใช้ WSL หรือเครื่องมือของบุคคลที่สามเช่น 7-Zip.
กรณีการใช้งานทั่วไป
- Backup and Restore: เหมาะสําหรับการสร้าง backup ของ directories และไฟล์โดยไม่ต้องบีบอัด.
- การกระจายไฟล์: จัดส่งชุดไฟล์ขนาดใหญ่ผ่านเครือข่ายในรูปแบบที่ไม่บีบอัด.
- การจัดการรหัสแหล่งข้อมูล: บันดคอยโพรพิทอรีรโค้ดก่อนที่จะอัพโหลดไปยังระบบควบคุมเวอร์ชันหรือแบ่งปันกับผู้ร่วมมือ.
ข้อดีและข้อ จํากัด
ข้อด:
- โครงสร้างที่เรียบง่ายและเข้าใจง่าย
- ความเข้ากันได้ cross-platform
- การเก็บข้อมูล metadata รายละเอียด
ข้อ จํากัด:
- ไม่มีการสนับสนุนการบีบอัดแบบบูรณาการ (โดยเฉพาะอย่างยิ่งการขยายตัวเช่น
.tar.gz
ใช้กันอย่างแพร่หลาย) - ขนาดไฟล์ขนาดใหญ่เมื่อเทียบกับรูปแบบที่บีบอัด
ผู้พัฒนาทรัพยากร
การเขียนโปรแกรมด้วยไฟล์ TAR ได้รับการสนับสนุนผ่าน APIs และห้องสมุดต่างๆ ตัวอย่างรหัสและคู่มือการดําเนินการจะถูกเพิ่มเร็ว ๆ น.
คําถามที่ถามบ่อย
ทําไมไฟล์ TAR ไม่ได้มีหมายเลขมหัศจรรย?
ไม่เหมือนกับรูปแบบไฟล์อื่น ๆ TAR ไม่ใช้ตัวระบุที่เฉพาะเจาะจงในตอนแรกของไฟล์เพื่อระบุประเภทของมัน แทนนั้นมันขึ้นอยู่กับโครงสร้างและเนื้อหาภายในไฟล์สําหรับการระบ.
ฉันจะตรวจสอบว่าไฟล์ TAR ได้เสร็จสมบูรณ์หรือไม?
ตรวจสอบให้แน่ใจว่าสองบล็อกสุดท้ายของไฟล์จะเต็มไปด้วยศูนย์ไบนารี (512 บิต end-of-file markers) ซึ่งหมายความว่าไฟล์นี้ได้รับการเสร็จสมบูรณ์อย่างถูกต้อง.
ความแตกต่างระหว่างไฟล์ .tar และ .ar.gz คืออะไร?
แพลตฟอร์ม
.tar
ไฟล์เป็นเอกสารที่ไม่มีการบีบอัด ในขณะท.tar.gz
ไฟล์จะถูกบีบอัดโดยใช้ gzip compression เพื่อลดขนาด.