Format plików
Przegląd
Archiwum TAR, reprezentujące Tape ARchive, są niezbędne w świecie zarządzania plikami, zwłaszcza na systemach opartych na Unix. Utworzone w 1979 roku przez AT&T Bell Laboratories, pliki TAR służą jako prosty, ale potężny mechanizm do łączenia wielu pliku i adresarzy do jednego archiwu bez kompresji. Ten format jest szeroko stosowany w różnych systemów operacyjnych ze względu na jego prostość i kompatybilność. Czy jesteś deweloperem szukającym kodu źródłowego pakietu lub administratora systemu zarządzającego kopie zapasowe, zrozumienie wkładów i wyjściów plika TAR może znacznie poprawić przepływ pracy.
Główne cechy
- Uncompressed Storage: TAR przechowuje dane w niekompresowanej formie, dzięki czemu są idealne do szybkich przesyłek plików bez obaw o nadmiar kompresji.
- Detailed Metadata: Każdy plik w archiwum TAR zawiera metadane, takie jak tabele czasowe, szczegóły własności i zezwolenia, zapewniając zachowanie oryginalnego kontekstu każdego pliku.
- Cross-Platform Compatibility: Pomimo korzeni w systemach Unix, pliki TAR są obsługiwane przez większość nowoczesnych systemów operacyjnych, dzięki czemu są wszechstronne w różnych środowiskach.
- Standardyzowany format: Format jest zgodny ze standardami POSIX (POSIX.1-1988 i później POSix.1-2001), zapewniając spójność w różnych implementacjach.
- End-of-File Marker: pliki TAR zawierają dwukrotny marker końcowy pliku, który pomaga zidentyfikować punkt zakończenia archiwum.
Specyfikacje techniczne
Format struktury
TAR jest formatem opartym na tekście, który organizuje dane do bloków o wielkości 512 bajtów. Każdy blok może reprezentować albo tytuł lub zawartość pliku. Brak magicznego numeru odróżnia go od innych formatów, takich jak ZIP, gdzie określone identyfikatory są używane do rozpoznawania typu archiwum.
Podstawowe składniki
- Header Block: Zawiera metadane dotyczące każdego pliku, takie jak nazwa, tryb, identyfikator użytkownika, ID grupy, rozmiar i czas.
- File Content Blocks: Śledź bloky nagłówków i zawieraj rzeczywiste dane plików.Bloky te mogą być zgrupowane w większe jednostki dla efektywnych operacji I/O (blokowanie).
- End-of-File Marker: składa się z dwóch 512-bitowych bloków wypełnionych zerami binarnymi, aby oznaczać koniec archiwum.
Standardy i zgodność
TAR przestrzega standardów POSIX, zapewniając kompatybilność między różnymi systemami i wersjami. podczas gdy nie obsługuje kompresji native, różne rozszerzenia, takie jak .tar.gz
(gzip) lub .tar.bz2
(bzip2) są powszechnie używane do kompresowanych archiwów TAR.
Historia i ewolucja
- 1979: Pierwszy wprowadzony przez AT&T Bell Laboratories.
- POSIX.1-1988 i POSIX1-2001: Standardy zostały ustanowione w celu standardyzacji formatu, zapewniając spójność w różnych implementacjach.
- GNU Tar: Wzmocniona wersja z dodatkowymi funkcjami, takimi jak rozszerzenia pax dla lepszej kompatybilności.
Praca z Tar Files
Otwarcie plików
Aby otworzyć plik TAR:
- Windows: Instaluj 7-Zip lub korzystaj z Windows Subsystem dla Linux (WSL).
- Mac: Podwójnie kliknij plik, aby go wyciągnąć.
- Linux – używanie
tar -xvf
Komendy w terminalu.
Konwertowanie plików
Wspólne konwersje obejmują kompresję plików TAR do .tar.gz
, .tar.bz2
, Na przykład, konwersja płaskiego pliku TAR do gzip-kompresowanego można wykonać za pomocą:
tar -czf archive.tar.gz directory/
Tworzenie plików
Aby utworzyć nowy plik TAR na systemach Linux lub Unix:
tar -cvf archive.tar /path/to/directory
W systemie Windows można korzystać z narzędzi WSL lub osób trzecich, takich jak 7-Zip.
Typowe zastosowania
- Backup and Restore: Idealny do tworzenia kopii zapasowych katalogów i plików bez kompresji.
- Dystrybucja plików: dystrybacja dużych zestawów pliku w sieciach w niekompresowanym formacie.
- Zarządzanie kodem źródłowym: łączenie repozytoriów kodów źródeł przed przesyłaniem do systemów sterowania wersjami lub udostępnianiem ich współpracownikom.
Korzyści i ograniczenia
Zalety:
- Prosta i łatwa do zrozumienia struktura
- Kompatybilność cross-platform
- Szczegółowe przechowywanie metad
Ograniczenia:
- Brak wbudowanej obsługi kompresji (zwłaszcza rozszerzenia, takie jak
.tar.gz
są szeroko wykorzystywane) - Większe rozmiary plików w porównaniu do formatów kompresowanych
Rozwój zasobów
Programowanie z plikami TAR jest wspierane za pośrednictwem różnych API i bibliotek. Przykłady kodów i przewodniki wdrażania zostaną wkrótce dodane.
Często zadawane pytania
Dlaczego plik TAR nie ma magicznego numeru?
W przeciwieństwie do innych formatów archiwów, TAR nie używa określonego identyfikatoru na początku pliku, aby oznaczyć jego typ.
Jak mogę sprawdzić, czy plik TAR jest kompletny?
Upewnij się, że ostatnie dwa bloki pliku są wypełnione zerami binarnymi (512-bitowy marker końcowy.
Jaka jest różnica między plikami .tar i .ar.gz?
płaski
.tar
Archiwum jest niekompresyjnym archiwem, a.tar.gz
Plik jest komprimowany za pomocą kompresji gzip w celu zmniejszenia rozmiaru.