định dạng file
Tổng quan
Các tệp TAR, đại diện cho Tape ARchive, là rất cần thiết trong thế giới quản lý tập tin, đặc biệt là trên các hệ thống dựa trên Unix. Được tạo ra vào năm 1979 bởi AT&T Bell Laboratories, các file TAR phục vụ như là một cơ chế đơn giản nhưng mạnh mẽ để kết hợp nhiều file và thư mục vào một lưu trữ duy nhất mà không bị nén. định dạng này được sử dụng rộng rãi trên nhiều hệ điều hành khác nhau do sự dễ dàng và tương thích của nó. Cho dù bạn là nhà phát triển đang tìm kiếm mã nguồn gói hoặc một quản trị viên Hệ thống quản lí sao lưu, hiểu các bản in và outs của các tài liệu TAR có thể cải thiện đáng kể dòng công việc của bạn.
Đặc điểm chính
- Lưu trữ không nén (Uncompressed Storage) – TAR lưu giữ dữ liệu trong một hình thức không sập, làm cho chúng lý tưởng cho việc chuyển tập tin nhanh chóng mà không cần phải lo lắng về quá trình hàn nàn.
- Metadata chi tiết: Mỗi tệp trong một lưu trữ TAR bao gồm các metadata như bảng thời gian, thông tin sở hữu và quyền, đảm bảo rằng bối cảnh ban đầu của mỗi tập tin được bảo tồn.
- Cross-Platform Compatibility: Mặc dù có nguồn gốc trong hệ thống Unix, các tập tin TAR được hỗ trợ bởi hầu hết các hệ điều hành hiện đại, làm cho chúng đa dạng cho các môi trường khác nhau.
- Thông thức tiêu chuẩn: Các định dạng tuân thủ các tiêu chí POSIX (POSIX.1-1988 và sau đó POSix.1-2001), đảm bảo sự phù hợp giữa các ứng dụng khác nhau.
- End-of-File Marker: Các tập tin TAR bao gồm một thẻ kết thúc hai khối, giúp xác định điểm chấm dứt của lưu trữ.
Đặc điểm kỹ thuật
định dạng cấu trúc
TAR là một định dạng dựa trên văn bản mà tổ chức dữ liệu thành các khối 512 byte. mỗi khối có thể đại diện cho cả một tiêu đề hoặc nội dung tệp. sự vắng mặt của một số phép thuật làm cho nó khác biệt với các hình thức khác như ZIP, nơi xác định cụ thể được sử dụng để nhận ra loại lưu trữ.
Các thành phần cơ bản
- Header Block: chứa metadata về mỗi tệp như tên, chế độ, ID người dùng, nhóm ID, kích cỡ và thời gian.
- File Content Blocks: Theo các khối tiêu đề và chứa dữ liệu tập tin thực tế. Những khối này có thể được nhóm thành đơn vị lớn hơn cho hoạt động I/O hiệu quả (blocking).
- End-of-File Marker: bao gồm hai khối 512 byte được lấp đầy với zer binary để có nghĩa là kết thúc của một tập tin.
Tiêu chuẩn & tương thích
TAR tuân thủ các tiêu chuẩn POSIX, đảm bảo khả năng tương thích trên các hệ thống và phiên bản khác nhau. trong khi nó không hỗ trợ nén bản địa, các phần mở rộng như .tar.gz
(gzip) hoặc .tar.bz2
(bzip2) thường được sử dụng cho các tệp TAR nén.
Lịch sử & Evolution
- 1979: Đầu tiên được giới thiệu bởi AT&T Bell Laboratories.
- POSIX.1-1988 và POSIX1-2001: Các tiêu chuẩn đã được thiết lập để chuẩn hóa định dạng, đảm bảo sự phù hợp giữa các ứng dụng khác nhau.
- GNU Tar: Phiên bản nâng cao với các tính năng bổ sung như mở rộng pax để tương thích tốt hơn.
Làm việc với TAR Files
Khởi mở file
Để mở một file TAR:
- Windows: Cài đặt 7-Zip hoặc sử dụng Windows Subsystem for Linux (WSL).
- Mac: Nhấp hai lần vào tệp để lấy nó.
- Linux: Sử dụng
tar -xvf
Lệnh tại Terminal.
Chuyển đổi file
Chuyển đổi phổ biến bao gồm nén các tập tin TAR vào .tar.gz
, .tar.bz2
, Ví dụ, chuyển đổi một tập tin TAR thẳng thành một tắt gzip có thể được thực hiện với:
tar -czf archive.tar.gz directory/
Tạo các file
Để tạo một tệp TAR mới trên hệ thống Linux hoặc Unix:
tar -cvf archive.tar /path/to/directory
Trên Windows, bạn có thể sử dụng WSL hoặc các công cụ của bên thứ ba như 7-Zip.
Các trường hợp sử dụng chung
- Backup and Restore: Tốt nhất để tạo sao lưu các thư mục và tệp mà không bị nén.
- File Distribution: phân phối các tập tin lớn trên các mạng trong một định dạng không bị nén.
- Quản lý mã nguồn: Liên kết các thư viện code nguồn trước khi tải lên các hệ thống điều khiển phiên bản hoặc chia sẻ với các cộng tác viên.
Lợi ích & Giới hạn
Lợi ích:
- Đơn giản và dễ hiểu cấu trúc
- Sự tương thích cross-platform
- Bảo tồn metadata chi tiết
Giới hạn:
- Không có hỗ trợ nén tích hợp (đặc biệt là mở rộng như
.tar.gz
được sử dụng rộng rãi) - Kích thước tệp lớn hơn so với các định dạng nén
Tài nguyên nhà phát triển
Chương trình với các tệp TAR được hỗ trợ thông qua các APIs và thư viện khác nhau. ví dụ mã và hướng dẫn thực hiện sẽ sớm được thêm vào.
Những câu hỏi thường gặp
Tại sao một tệp TAR không có số phép thuật?
Không giống như các định dạng lưu trữ khác, TAR không sử dụng một ID cụ thể ở đầu tệp để đánh dấu kiểu của nó.
Làm thế nào tôi có thể kiểm tra nếu một tệp TAR đã hoàn thành?
Đảm bảo rằng hai khối cuối cùng của tệp được lấp đầy với phân tử nhị phân (512-bit end-of-file marker.
Câu là sự khác biệt giữa .tar và .ar.gz tệp?
Đơn giản
.tar
file là một tập tin không bị nén, trong khi một.tar.gz
file được nén bằng gzip compression để giảm kích thước.