Использование tar. Использование tar в Linux и FreeBSD для работы с архивами


Простая схема резервирования состоит в том, чтобы все сохранить однажды, а затем резервировать все что изменилось, начиная с предыдущей копии. Первая копия называется полной (full backup) , последующие инкрементными (incremental backups) . Полная копия часто не помещается целиком на ленту (или дискету). Восстановление из инкрементных копий может потребовать во много раз большего количество работы, чем из полного. Восстановление может быть оптимизировано так, чтобы Вы всегда резервировали все, начиная с предыдущей полной копии; этот путь требует немного больше работы, но никогда не будет потребности восстановить больше, чем полную и одну инкрементную копию.

Если Вы хотите делать копии ежедневно и иметь шесть лент, Вы могли бы использовать ленту 1 для первой полной копии (скажем, в пятницу) и ленты со 2 по 5 для инкрементных копий (понедельник-четверг). Затем Вы делаете новую полную копию на ленте 6 (вторая пятница), и снова начинаете делать инкрементные копии на лентах 2-5. Вы не хотите перезаписывать ленту 1, пока вы не имеете новую полную копию, чтобы ничего страшного не произошло в то время, пока вы делаете новую полную копию. После того, как вы сделали полную копию на ленте 6, Вы можете хранить ленту 1 где-нибудь еще на случай разрушения ваших других резервных лент. Когда Вы должны сделать следующую полную копию, Вы выбираете и используете ленту 1.

Если Вы имеете больше чем шесть лент, Вы можете использовать дополнительное место для полных копий. Каждый раз, когда Вы делаете полную копию, Вы используете самую старую ленту. Этим путем Вы можете иметь полные копии за несколько предыдущих недель, что хорошо, если Вы хотите найти старый, теперь удаленный файл, или старую версию файла.

Резервирование с применением tar

Полная копия может легко быть сделана командой tar :

# tar --create --file /dev/ftape /usr/src

Пример выше использует GNU версию tar и длинные имена опции. Традиционная версия tar понимает только одиночный символ в качестве парамета. GNU версия может также обрабатывать копии, которые не помещаются на одной ленте или дискете, и очень длинные пути; не все традиционные версии могут делать это. Linux использует только GNU tar .

Если ваша копия не помещается на одной ленте, Вы должны использовать опцию --multi-volume (-M ):

# tar -cMf /dev/fd0H1440 /usr/src

tar: Removing leading / from absolute path names in the archive

Prepare volume #2 for /dev/fd0H1440 and hit return:

Обратите внимание, что Вы должны форматировать дискеты прежде, чем Вы начнете копирование. Можно использовать другое окно или виртуальный терминал для выполнения команд форматирования, когда tar попросит новую дискету.

После того, как вы сделали копию, Вы должны ее проверить, используя опцию --compare (-d ):

# tar --compare --verbose -f /dev/ftape

usr/src/

usr/src/linux

....

Невыполнение проверки копии означает, что Вы не заметите, что ваша копия не работает, пока не потеряете первоначальные данные.

Инкрементная копия может быть выполнена командой tar с опцией --newer (-N ):

# tar --create --newer "8 Sep 1995" --file /dev/ftape /usr/src --verbose

tar: Removing leading / from absolute path names in the archive

usr/src/

usr/src/linux-1.2.10-includes/

usr/src/linux-1.2.10-includes/include/linux/modules/

usr/src/linux-1.2.10-includes/include/asm-generic/

usr/src/linux-1.2.10-includes/include/asm-i386/

usr/src/linux-1.2.10-includes/include/asm-mips/

usr/src/linux-1.2.10-includes/include/asm-alpha/

usr/src/linux-1.2.10-includes/include/asm-m68k/

usr/src/linux-1.2.10-includes/include/asm-sparc/

usr/src/patch-1.2.11.gz

К сожалению, tar не может обнаружить изменение Inode информации файла, например, изменение прав доступа или переименование файла. Проблема решается путем использования команды find и сравнения текущего состояния файловой системы со списками файлов, которые резервировались раньше. Скрипты и программы для автоматизации такого процесса можно найти на ftp-серверах, посвященных Linux.

Восстановление с применением tar

Команда tar с опцией --extract (-x ) извлекает файлы:

# tar --extract --same-permissions --verbose --file /dev/fd0H1440

usr/src/

usr/src/linux

usr/src/linux-1.2.10-includes/

usr/src/linux-1.2.10-includes/include/

usr/src/linux-1.2.10-includes/include/linux/

...

Вы также можете извлечь только указанные файлы или каталоги (которые включают все их файлы и подкаталоги),перечислив их в командной строке:

# tar xpvf /dev/fd0H1440 usr/src/linux-1.2.10-includes/include/linux/hdreg.h

usr/src/linux-1.2.10-includes/include/linux/hdreg.h

Используйте опцию --list (-t ), если Вы хотите только увидеть какие файлы находятся на резервном томе:

# tar --list --file /dev/fd0H1440

usr/src/

usr/src/linux

usr/src/linux-1.2.10-includes/

usr/src/linux-1.2.10-includes/include/

usr/src/linux-1.2.10-includes/include/linux/

usr/src/linux-1.2.10-includes/include/linux/hdreg.h

usr/src/linux-1.2.10-includes/include/linux/kernel.h

...

Обратите внимание, что tar всегда читает резервный том последовательно, так для больших томов процесс довольно медленный. Однако, нельзя использовать произвольный доступ, когда используется лента или некоторая другая последовательная среда.

tar не обрабатывает удаленные файлы правильно. Если Вы должны восстановить файловую систему из полной и инкрементной копии, и удалили файл между изготовлением копий, он будет существовать снова после того, как Вы сделаете восстановление. Это может быть большой проблемой, если файл хранит важные данные, которые больше не должны быть доступны.



man tar Использование: tar [ОПЦИЯ...] [ФАЙЛ]...
GNU `tar" предназначен для сохранения файлов
на магнитную ленту или в архив на диске и
для восстановления отдельных файлов из
архива.

Примеры:
tar -cf archive.tar foo bar # Создание archive.tar из файлов
foo и bar.
tar -tvf archive.tar # Вывод подробного списка
всех файлов в архиве archive.tar.
tar -xf archive.tar # Извлечение всех файлов
из archive.tar.

Основной режим работы:

A, --catenate, --concatenate присоедининие tar-файлов
к архиву
-c, --create создание нового архива
-d, --diff, --compare поиск различий между
архивом и файловой
системой
--delete удаление из архива (не на
магнитных лентах!)
-r, --append добавление файлов в конец
архива
-t, --list вывод списка содержимого
архива
--test-label проверка метки тома архива
и выход
-u, --update добавление в архив только
более новых файлов
-x, --extract, --get извлечение файлов из
архива

Модификаторы:

Check-device check device numbers when
creating incremental
archives (default)
-g, --listed-incremental=ФАЙЛ
обработка добавочного
резервирования нового
формата GNU
-G, --incremental обработка добавочного
резервирования старого
формата GNU
--ignore-failed-read не завершать работу при
ненулевом статусе для
нечитаемых файлов
-n, --seek доступен поиск по архиву
--no-check-device do not check device numbers when creating
incremental archives
--occurrence[=N] обработка только N-ого
вхождения для каждого
файла в архиве. Эта опция
верна только в сочетании с
одной из подкоманд --delete,
--diff, --extract или --list, и когда
список файлов задан либо в
командной строке, либо
через опцию -T. По умолчанию
N равен 1.
--sparse-version=MAJOR[.MINOR]
установить версию
используемого формата
разрежения (подразумевает
--sparse)
-S, --sparse эффективная обработка
разрежённых файлов

Управление перезаписью:

K, --keep-old-files не перезаписывать
существующие файлы при
извлечении
--keep-newer-files не перезаписывать
существующие файлы,
которые более новые, чем их
копии в архиве
--no-overwrite-dir сохранение метаданных
существующих каталогов
--overwrite перезапись существующих
файлов при извлечении
--overwrite-dir перезапись существующих
файлов при извлечении (по
умолчанию)
--recursive-unlink очистка всей иерархии до
извлечения каталога
--remove-files удаление файлов после их
добавления в архив
-U, --unlink-first удаление каждого файла до
извлечения поверх него
-W, --verify попытка проверить архив
после его записи

Выбор выходного потока:

Ignore-command-error игнорировать коды
завершения дочерних
процессов
--no-ignore-command-error считать ненулевые коды
завершения дочерних
процессов как ошибку
-O, --to-stdout извлекать файлы на
стандартный вывод
--to-command=КОМАНДА
перенаправлять
извлечённые файлы в другую
программу

Обработка атрибутов файлов:

Atime-preserve[=СПОСОБ]
сохранять время доступа
скопированных файлов путём
восстановления времени
после чтения (СПОСОБ="replace";
используется по умолчанию)
или не установки времени в
первую очередь
(СПОСОБ="system")
--delay-directory-restore не устанавливать время
изменения и права доступа
извлечённых каталогов до
завершения процесса
извлечения
--group=ИМЯ принудительно
устанаваливать ИМЯ в
качестве группы для
добавленных файлов
--mode=РЕЖИМ принудительно
устанавливать (символьный)
РЕЖИМ доступа для
добавляемых файлов
--mtime=ДАТА-ИЛИ-ФАЙЛ
устанаваливать для
добавленных файлов mtime из
ДАТЫ-ИЛИ-ФАЙЛА
-m, --touch не извлекать время
изменения файла
--no-delay-directory-restore
отменить действие опции
--delay-directory-restore
--no-same-owner извлекать файлы как свои
собственные
--no-same-permissions применять umask пользователя
при извлечении прав
доступа из архива (по
умолчанию для обычных
пользователей)
--numeric-owner использовать числа вместо
имён владельца/группы
--owner=ИМЯ принудительно
устанаваливать ИМЯ в
качестве владельца для
добавленных файлов
-p, --preserve-permissions, --same-permissions
извлекать информацию о
правах доступа к файлу (по
умолчанию для
суперпользователя)
--preserve эквивалент -p и -s
--same-owner попытаться извлечь файлы с
тем же владельцем
-s, --preserve-order, --same-order
сортировать извлекаемые
имена в том же порядке, что
и в архиве

Выбор и переключение устройств:

F, --file=АРХИВ использовать файл или
устройство АРХИВ
--force-local файл архива является
локальным, даже если
содержит двоеточие
-F, --info-script=ИМЯ, --new-volume-script=ИМЯ
запустить скрипт по
окончании каждой ленты
(подразумевается
использование -М)
-L, --tape-length=N сменить ленту после записи
ЧИСЛО x 1024 байт
-M, --multi-volume
создание/листинг/извлечение
многотомных архивов
--rmt-command=КОМАНДА
использовать указанную
КОМАНДУ rmt вместо rmt
--rsh-command=КОМАНДА
использовать удалённую
КОМАНДУ вместо rsh
--volno-file=ФАЙЛ использовать/обновлять
номера тома в ФАЙЛЕ

Разбиение на блоки:

B, --blocking-factor=БЛОКИ
число БЛОКОВ x 512 байт на
запись
-B, --read-full-records заново разбивать на блоки
при чтении (для каналов
4.2BSD)
-i, --ignore-zeros игнорировать нулевые блоки
в архиве (т.е. EOF)
--record-size=N ЧИСЛО байт на запись,
кратное 512

Формата архива:

H, --format=ФОРМАТ создать архив в указанном
формате

ФОРМАТОМ может быть:

Gnu формат GNU tar 1.13.х
oldgnu формат GNU как в tar <= 1.12
pax формат POSIX 1003.1-2001 (pax)
posix эквивалент pax
ustar формат POSIX 1003.1-1988 (ustar)
v7 старый формат tar V7

Old-archive, --portability
эквивалент --format=v7

Pax-option=keyword[[:]=значение][,keyword[[:]=значение]]
управляющие ключевые слова
pax
--posix эквивалент --format=posix
-V, --label=ТЕКСТ создать архив с именем тома
ТЕКСТ; при
листинге/извлечении
использовать ТЕКСТ в
качестве шаблона
подстановки

Compression options:

A, --auto-compress use archive suffix to determine
the compression program
-j, --bzip2 пропустить архив через bzip2
--lzma filter the archive through lzma
--use-compress-program=ПРОГ
пропустить архив через
ПРОГ (должна поддерживать
-d)
-z, --gzip, --gunzip, --ungzip пропустить архив через
gzip
-Z, --compress, --uncompress пропустить архив через
compress

Выбор локальных файлов:

Add-file=ФАЙЛ добавить указаный ФАЙЛ в
архив (полезно, если имя
начинается с дефиса)
--backup[=УПРАВЛЕНИЕ]
делать копию перед
удалением, УПРАВЛЕНИЕ
выбора версий
-C, --directory=КАТАЛОГ перейти в КАТАЛОГ
--exclude=ШАБЛОН исключать файлы,
определённые ШАБЛОНОМ
--exclude-caches исключать содержимое
каталогов с файлом CACHEDIR.TAG
за исключением самого
файла с тегами
--exclude-caches-all исключать каталоги,
содержащие файл CACHEDIR.TAG
--exclude-caches-under исключать всё содержимое
каталогов, содержащих файл
CACHEDIR.TAG
--exclude-tag=ФАЙЛ исключать каталоги,
содержащие ФАЙЛ, за
исключением самого ФАЙЛА
--exclude-tag-all=ФАЙЛ исключать каталоги с
ФАЙЛОМ
--exclude-tag-under=ФАЙЛ
исключать всё содержимое
каталогов, содержащих ФАЙЛ
--exclude-vcs исключать каталоги CVS
-h, --dereference следовать по символьным
ссылкам и сохранять файлы,
на которые они указывают
--hard-dereference follow hard links; archive and
dump the files they
refer to
-K, --starting-file=ИМЯ-ЧЛЕНА
начинать с члена ИМЯ-ЧЛЕНА
в архиве
--newer-mtime=ДАТА сравнивать дату и время,
только если изменены
данные
--no-recursion отключить автоматический
спуск в каталоги
--no-unquote не убирать кавычки с имён
файлов, прочитанных с
опцией -T
--null -T читает строки,
оканчивающиеся нулём,
отключает опцию -C
-N, --newer=ДАТА-ИЛИ-ФАЙЛ, --after-date=ДАТА-ИЛИ-ФАЙЛ
сохранять только те файлы,
которые новее
ДАТЫ-ИЛИ-ФАЙЛА
--one-file-system оставаться в локальной
файловой системе при
создании архива
-P, --absolute-names не удалять начальные `/" из
имен файлов
--recursion рекурсивный спуск по
каталогам (по умолчанию)
--suffix=СТРОКА делать копию перед
удалением, переопределяет
обычный суффикс ("~", если
только он не переопределён
переменной окружения
SIMPLE_BACKUP_SUFFIX)
-T, --files-from=ФАЙЛ загрузить из ФАЙЛА имена
для извлечения или
создания
--unquote убрать кавычки с имён
файлов, прочитанных с
опцией -T (по умолчанию)
-X, --exclude-from=ФАЙЛ исключать шаблоны,
перечисленных в ФАЙЛЕ

Преобразвание имён файлов:

Strip-components=N удалять указанное ЧИСЛО
начальных компонентов из
имён файлов перед
извлечением
--transform=РАСШИРЕНИЕ
использовать замену
РАСШИРЕНИЯ sed"ом для
преобразования имён файлов

Параметры шаблонов подстановки для имён
файлов (вляют на шаблюны включения и
исключения):

Anchored шаблоны начала имени файла
--ignore-case игноририровать регистр
--no-anchored шаблоны после любого "/" (по
умолчанию для исключаемых)
--no-ignore-case с учётом регистра (по
умолчанию)
--no-wildcards точное соответствие
строке
--no-wildcards-match-slash маски не соответствуют
"/"
--wildcards использовать маски (по
умолчанию для исключаемых)
--wildcards-match-slash маски соответствут "/" (по
умолчанию для исключаемых)

Вывод информации:

Checkpoint[=N] вывод сообщений о ходе
выполнения через каждые
ЧИСЛО записей (по умолчанию
10)
--checkpoint-action=ACTION execute ACTION on each checkpoint
--index-file=ФАЙЛ отправить подробный вывод
данных в FILE
-l, --check-links вывод сообщений, если
сохранены не все ссылки
--no-quote-chars=СТРОКА
отключить цитирование
символов из СТРОКИ
--quote-chars=СТРОКА дополнительно
цитировать символы из
СТРОКИ
--quoting-style=СТИЛЬ установить стиль
цитирования имён. Значения
для СТИЛЯ см. ниже
-R, --block-number выводить номера блоков
архива в каждом сообщении
--show-defaults показать значения tar по
умолчанию
--show-omitted-dirs при выводе листинга или
извлечении показывать все
каталоги, не
соответствующем условию
поиска
--show-transformed-names, --show-stored-names
показывать имена файлов
или архивов после
преобразования
--totals[=СИГНАЛ] вывод общего числа байт
после обработки архива; с
аргументом - вывод общего
числа байт после доставки
этого СИГНАЛА. Разрешённые
сигналы: SIGHUP, SIGQUIT, SIGINT, SIGUSR1
и SIGUSR2. Также разрешается
использовать имена без
префикса SIG
--utc вывод даты изменения файла
в формате UTC
-v, --verbose подробный листинг
обрабатываемых файлов
-w, --interactive, --confirmation
запрашивать подтверждение
для каждого действия

Опции совместимости:

O при создании, эквивалент
--old-archive; при извлечении,
эквивалент --no-same-owner

Другие опции:

Help вывод этой справки
--restrict отключить использование
некоторых потенциально
опасных опций
--usage вывод короткого сообщения
об использовании
--version вывод версии программы

Обязательные или необязательные аргументы
для длинный опций также являются
обязательными или необязательными для
соответствующих коротких опций.

Суффикс для резервных копий - `~", если он не
установлен через --suffix
или SIMPLE_BACKUP_SUFFIX. Управление версиями может
быть установлено
через --backup или VERSION_CONTROL. Значениями могут
быть:

None, off не создавать резервные копии
t, numbered создавать нумерованные
резервные копии
nil, existing нумерованные, если существуют
нумерованные копии, иначе простые
never, simple всегда создавать простые
резервные копии

Допустимые агрументы для опций --quoting-style:

Literal
shell
shell-always
c
c-maybe
escape
locale
clocale

Значения по умолчанию *этого* tar:
--format=gnu -f- -b20 --quoting-style=escape --rmt-command=/usr/sbin/rmt
--rsh-command=/usr/bin/rsh

В качестве инструмента для архивации данных в Linux используются разные программы. Например , приобретший большую популярность из-за совместимости с ОС Windows. Но это не стандартная для системы программа. Поэтому хотелось бы осветить команду tar Linux - встроенный архиватор.

Изначально tar использовалась для архивации данных на ленточных устройствах. Но также она позволяет записывать вывод в файл, и этот способ стал широко применяться в Linux по своему назначению. Здесь будут рассмотрены самые распространенные варианты работы с этой утилитой.

Синтаксис команд для создания и распаковки архива практически не отличается (в том числе с утилитами сжатия bzip2 или gzip ). Так, чтобы создать новый архив, в терминале используется следующая конструкция:

tar опции архив.tar файлы_для_архивации

Для его распаковки:

tar опции архив.tar

Функции, которые может выполнять команда:

При определении каждой функции используются параметры, которые регламентируют выполнение конкретных операций с tar-архивом:

Как пользоваться tar

С помощью следующей команды создается архив archive.tar с подробным выводом информации, включающий файлы file1 , file2 и file3 :

tar --totals --create --verbose --file archive.tar file1 file2 file3

Но длинные опции и параметры можно заменить (при возможности) однобуквенными значениями:

tar --totals -cvf archive.tar file1 file2 file3

2. Просмотр содержимого архива

Следующая команда выводит содержимое архива, не распаковывая его:

tar -tf archive.tar

3. Распаковка архива tar Linux

Распаковывает архив test.tar с выводом файлов на экран:

tar -xvf archive.tar

Чтобы сделать это в другой каталог, можно воспользоваться параметром -C :

tar -C "Test" -xvf archive.tar

3. Работа со сжатыми архивами

Следует помнить, что tar только создаёт архив, но не сжимает. Для этого используются упомянутые компрессорные утилиты bzip2 и gzip . Файлы, сжатые с их помощью, имеют соответствующие расширения .tar.bz2 и .tar.gz . Чтобы создать сжатый архив с помощью bzip2, введите:

tar -cjvf archive.tar.bz2 file1 file2 file3

Синтаксис для gzip отличается одной буквой в параметрах, и меняется окончание расширения архива:

tar -czvf archive.tar.gz file1 file2 file3

При распаковке tar-архивов с таким расширением следует указывать соответствующую опцию:

tar -C "Test" -xjvf arhive.tar.bz2

tar -xzvf archive.tar.gz

На заметку: архиватор tar - одна из немногих утилит в GNU/Linux, в которой перед использованием однобуквенных параметров, стоящих вместе, можно не ставить знак дефиса.

Выводы

В этой статье была рассмотрена команда tar Linux, которая используется для архивации файлов и поставляется по умолчанию во всех дистрибутивах. В её возможности входит создание и распаковка архива файлов без их сжатия. Для сжатия утилита применяется в связке с популярными компрессорами bzip2 и gzip .

В наши дни мы сталкиваемся с файлами архивов очень часто и на всех платформах: Windows, Mac или Linux. Это могут быть программы, резервные копии систем или баз данных или просто архив файлов. Нам также часто приходится создавать свои архивы в Linux, чтобы передать несколько файлов друзьям или загрузить на файлообменник. В виде архивов распространяются пакеты программ, исходные коды, а также много других файлов, распространяемых на просторах интернета. Научиться выполнять архивирование файлов в Linux через терминал очень важно, возможно это вам понадобиться, когда не будет доступа к графическому интерфейсу, или просто со временем в терминале станет более приятно работать.

В этой инструкции я хочу подробно рассмотреть утилиты для архивирования в Linux, мы рассмотрим не только самую популярную и универсальную утилиту - tar, но и другие менее известные, а также популярные алгоритмы сжатия.

Важно отметить, что архивирование в linux это не одно и то же что и сжатие файлов linux. Архивирование - это объединение нескольких небольших файлов в один, с целю более удобной последующей передачи, хранения, шифрования или сжатия. Как я уже сказал, архивация выполняется специальными утилитами. Мы не будем трогать архивацию файлов в графическом интерфейсе, вы с ними разберетесь сами, наша тема - терминал.

Самой популярной для Linux утилитой для архивации есть tar. Она используется почти везде, для архивации исходников, упаковки пакетов. Для сжатия используются другие утилиты, в зависимости от алгоритма сжатия, например, zip, bz, xz, lzma и т д. Сначала выполняется архивация, затем сжатие, отдельными программами. Автоматический запуск некоторых утилит сжатия для только что созданного архива поддерживается в tar и других подобных программах с помощью специальных опций.

Также полезной возможностью архивации есть шифрование. Но теперь давайте рассмотрим какие существуют утилиты, с помощью которых выполняется архивирование файлов linux и как ими пользоваться.

Tar

Tar - это стандартная утилита, с помощью которой выполняется архивирование файлов Linux. Постепенно из небольшой программы архивации она превратилась в мощный инструмент, поддерживающий работу со многими вариантами архивов и алгоритмами сжатия. Программа поддерживает большое количество параметров. Давайте рассмотрим ее синтаксис и основные параметры:

$ tar опцииf файл_для_записи /папка_файлами_для_архива

А теперь разберем основные опции:

  • A - добавить файл к архиву
  • c - создать архив в linux
  • d - сравнить файлы архива и распакованные файлы в файловой системе
  • j - сжать архив с помощью Bzip
  • z - сжать архив с помощью Gzip
  • r - добавить файлы в конец архива
  • t - показать содержимое архива
  • u - обновить архив относительно файловой системы
  • x - извлечь файлы из архива
  • v - показать подробную информацию о процессе работы
  • f - файл для записи архива
  • -C - распаковать в указанную папку
  • --strip-components - отбросить n вложенных папок

Теперь давайте рассмотрим архивирование файлов в Linux. Чтобы создать архив используйте такую команду:

tar -cvf archive.tar.gz /path/to/files

А чтобы распаковать архив tar linux:

tar -xvf archive.tar.gz

Очень просто запомнить для упаковки используется опция c - C reate, а для распаковки - x - eX tract.

Сжатый архив создается точно так же, только с опцией -z, это в случае, если использовалось шифрование gizp, если нужно bzip то применяется опция -j:

tar -zcvf archive.tar.gz /path/to/files

$ tar -zxvf archive.tar.gz

Например, рассмотрим как заархивировать папку в Linux:

tar -zcvf home.tar.gz ~/

Хотя можно поступить по-другому, тот же архив мы получим если сначала создать обычный архив с помощью tar, а потом сжать его утилитой для сжатия, только здесь мы получаем больше контроля над процессом сжатия:

gzip archive.tar

Также можно убрать сжатие:

gunzip archive.tar.gz

Утилиты сжатия мы рассмотрим ниже.

Чтобы добавить файл в архив используйте:

tar -rvf archive.tar file.txt

Для извлечения одного файла синтаксис тот же:

tar -xvf archive.tar file.txt

Можно извлечь несколько файлов по шаблону соответствия с помощью параметра wildcard, например, извлечем все php файлы:

tar -xvf archive.tar --wildcards "*.php"

По умолчанию распаковать архив tar linux можно в текущую папку с именем архива, чтобы распаковать в нужную папку используйте ключ -C:

tar -xvf archive.tar -C /path/to/dir

Стандартную утилиту рассмотрели, теперь кратко рассмотрим ее альтернативы. Их не так много, и большинство из них уже устаревшие.

Shar

Shar позволяет создавать самораспаковывающиеся архивы. По сути, это скрипт оболочки, и для распаковки ему необходима оболочка Bash или другая совместимая с Bourne Shell. У Shar есть несколько преимуществ, но также он потенциально небезопасный, так как архив представляет собой исполняемый файл.

Опции shar:

  • -o - сохранять архив в файл вместо стандартного вывода
  • -l - ограничить размер выходного файла
  • -L - ограничить размер выходного файла и разбить его на части
  • -n - имя архива не будет включено в заголовок
  • -a - разрешить автоматическую генерацию заголовков

Примеры использования shar для того чтобы заархивировать папку linux:

Создаем shar архив:

shar file_name.extension > filename.shar

Распаковываем shar архив:

Ar

ar - утилита для создания и управления архивами. В основном используется для архивации статических библиотек, но может быть использована для создания любых архивов. Раньше использовалась довольно часто но была вытеснена утилитой tar. Сейчас используется только для создания и обновления файлов статических библиотек.

  • - d - удалить модули из архива
  • - m - перемещение членов в архиве
  • - p - напечатать специфические члены архива
  • - q - быстрое добавление
  • - r - добавить члена к архиву
  • - s - создать индекс архива
  • - a - добавить новый файл к существующему архиву

Теперь рассмотрим примеры использования. Создадим статическую библиотеку libmath.a из объектных файлов substraction.o и division.o:

ar cr libmath.a substraction.o division.o

Теперь извлечем файлы из архива:

Таким образом, можно распаковать любую статическую библиотеку.

Cpio

cpio - означает Copy in and out (скопировать ввод и вывод). Это еще один стандартный архиватор для Linux. Активно используется в менеджере пакетов Red Hat, а также для создания initramfs. Архивация в Linux для обычных файлов с помощью этой программы не применяется.

Опции утилиты:

  • -a - сбросить время обращения к файлам после их копирования
  • -A - добавить файл
  • -d - создать каталоги при необходимости

Пример использования. Создаем cpio архив:

file1.o file2.o file3.o

ls | cpio -ov > /path/to/output_folder/obj.cpio

Распаковываем архив:

cpio -idv < /path/to folder/obj.cpio

Архивирование папки linux выполняется также само.

Сжатие архивов в Linux

Как создать архив в linux рассмотрели. Теперь давайте поговорим о сжатии. Как я говорил, для сжатия используются специальные утилиты. Рассмотрим кратко несколько из них

Gzip

Чаще всего применяется Gzip. Это стандартная утилита сжатия в Unix/Linux. Для декомпрессии используется gunzip или gzip -d Сначала рассмотрим ее синтаксис:

$ gzip опции файл

$ gunzip опции файл

Теперь разберем опции:

  • -c - выводить архив в стандартный вывод
  • -d - распаковать
  • -f - принудительно распаковывать или сжимать
  • -l - показать информацию об архиве
  • -r - рекурсивно перебирать каталоги
  • -0 - минимальный уровень сжатия
  • -9 - максимальный уровень сжатия

Примеры использования вы уже видели в описании утилиты tar. Например, выполним сжатие файла:

gzip -c файл > архив.gz

А теперь распакуем:

gunzip -c архив.gz

Но чтобы сжать папку в Linux вам придется сначала заархивировать ее с помощью tar, а уже потом сжать файл архива с помощью gzip.

Bzip

bzip2 - еще одна альтернативная утилита сжатия для Linux. Она более эффективная чем gzip, но работает медленнее. Для распаковки используйте утилиту bunzip2.

Описывать опции bzip2 я не буду, они аналогичны gzip. Чтобы создать архив в Linux используйте:

В текущем каталоге будет создан файл file.bz2

Lzma

Новый и высокоэффективный алгоритм сжатия. Синтаксис и опции тоже похожи на Gzip. Для распаковки используйте unlzma.

Xz

Еще один высокоэффективный алгоритм сжатия. Обратно совместимый с Lzma. Параметры вызова тоже похожи на Gzip.

Zip

Кроссплатформенная утилита для создания сжатых архивов формата zip. Совместимая с Windows реализациями этого алгоритма. Zip архивы очень часто используются для обмена файлами в интернете. С помощью этой утилиты можно сжимать как файлы, так и сжать папку linux.

Синтаксис утилиты:

$ zip опции файлы

$ unzip опции архив

Опции утилиты:

  • -d удалить файл из архива
  • -r - рекурсивно обходить каталоги
  • -0 - только архивировать, без сжатия
  • -9 - наилучший степень сжатия
  • -F - исправить zip файл
  • -e - шифровать файлы

Чтобы создать Zip архив в Linux используйте.

tar - это архиватор от GNU. tar берёт несколько файлов и/или каталогов и объединяет их в один большой файл. Это позволяет вам сжать целое дерево каталогов, что невозможно сделать с помощью или bzip2. У tar"а есть много опций, которые подробно описаны на его странице руководства.

$ man tar tar -xvvf foo.tar extract foo.tar tar -xvvzf foo.tar.gz extract gzipped foo.tar.gz tar -cvvf foo.tar foo/ tar contents of folder foo in foo.tar

Часто используемые ключи команды tar

    C – создать (create) новый архив

    X – извлечь (extract) файлы из архива

    –delete – удалить (delete) файлы из архива

    R – добавить (append) файлы в существующий архив

    A – добавить (append) tar-файлы в существующий архив

    T – список файлов в архиве (содержимое архива)

    U – обновить (update) архив

    D – операция сравнения архива с заданной файловой системой

    Z – обработка архива с помощью Примеры использования gzip и gunzip . Сжатие или разжатие, в зависимости от комбинации сопутствующих ключей -c или -x.

    J – обработка архива с помощью bzip2. Сжатие или разжатие, в зависимости от комбинации сопутствующих ключей -c или -x.

tar запускается с обязательным указанием одного из основных действий, самые распространенные из которых - создание и распаковка архивов, далее задаются прочие параметры, зависящие от конкретной операции.

Наиболее общее использование tar заключается в распаковке и разархивировании пакета, загруженного с веб- или ftp-сайта. Большинство файлов имеют расширение.tar.gz. Довольно часто их называют “tarball”"ами. Это означает несколько файлов, заархивированных tar"ом, а затем сжатых gzip"ом. Вы также можете встретить файлы.tar.Z. По сути это то же самое, однако встречаются они в основном на старых системах Unix.

Кроме того вы можете натолкнуться на файлы.tar.bz2. В таком виде распространяются исходные тексты ядра, поскольку так они занимают меньше места для загрузки. Как вы уже наверное догадались, это файлы, заархивированные tar"ом и сжатые bzip"ом.

Вы можете извлечь все файлы из такого архива, воспользовавшись tar"ом с несколькими опциями командной строки. Разархивирование тарбола выполняется с помощью опции -z, которая означает, что сначала файл должен быть пропущен через gunzip, а уже потом распакован. Наиболее общий метод распаковки тарболов:

% tar -xvzf файл.tar.gz

Здесь довольно много опций. Что же они означают? Опция -x означает извлечение. Это важно, поскольку она сообщает tar"у, что именно нужно сделать со входным файлом. В данном случае он будет снова разбит на файлы, из которых он был “слеплен”. Опция -v означает включение подробного режима. При этом на экран будут выведены названия всех извлекаемых из архива файлов. Неплохо было бы использовать эту опцию, чтобы распаковка не выглядела слишком скучно. Вы также можете использовать -vv, чтобы вывод был ещё более подробным и вы получили ещё больше информации об извлекаемых файлах. Опция -z сообщает tar"у о том, что файл.tar.gz нужно сначала пропустить через gunzip. И, наконец, опция -f сообщает tar"у, что следующая строка в командной строке - это файл, с которым надо работать.

Существует несколько способов записи этой же команды. На старых системах, на которых отсутствует подходящая копия GNU tar, вы можете увидеть следующую запись этой же команды:

% gunzip файл.tar.gz | tar -xvf -

В этой команде файл сначала распаковывается, а результат отправляется в tar. Т.к. gzip по умолчанию записывает выходные данные на стандартный вывод, эта команда будет записывать распакованный файл на стандартный вывод. Затем конвейер перенаправляет этот поток в tar для распаковки. Знак “-” означает, что данные берутся со стандартного входа. Таким образом команда разархивирует поток данных, полученный из gzip, и запишет его на диск.

Другим способом записи первоначальной команды является убирание знака “-” перед опциями:

% tar xvzf файл.tar.gz

Также вы можете натолкнуться на bzip"нутый архив. Версия tar, представленная в Slackware Linux, может работать с ними точно так же, как и с gzip"нутыми архивами. Просто вместо опции -z вам нужно использовать -j:

% tar -xvjf файл.tar.bz2

Учтите, что tar будет сохранять извлечённые из архива файлы в текущий каталог. Поэтому, если у вас в /tmp есть архив, который вы хотите распаковать в свой домашний каталог, у вас есть несколько вариантов. Первый - архив можно переместить в ваш домашний каталог, а затем развернуть его с помощью tar. Второй - вы можете указать путь к архиву в командной строке. Третий - вы можете использовать опцию -C, чтобы разархивировать тарбол в указанный после этой опции каталог.

% cd $HOME % cp /tmp/файл.tar.gz . % tar -xvzf файл.tar.gz % cd $HOME % tar -xvzf /tmp/файл.tar.gz % cd / % tar -xvzf /tmp/файл.tar.gz -C $HOME

Все приведенные выше записи являются эквивалентными. В каждой из них архив разворачивается в ваш домашний каталог, а исходный сжатый архив остаётся на месте.

Итак, что же хорошего в том, что вы можете распаковывать архивы, если вы не можете создавать их? tar умеет делать и это. В большинстве случаев можно просто заменить опцию “-x” на “-c”.

% tar -cvzf файл.tar.gz .

В этой команде опция -c сообщает tar"у, что нужно создать архив, а опция -z пропускает полученный архив через gzip, чтобы сжать его. файл.tar.gz - это имя создаваемого файла.

Указание опции “-f” не всегда есть обязательным, однако в любом случае лучше её использовать. Без неё tar будет записывать свои данные на стандартный вывод, что обычно используется для перенаправления потока по конвейеру в другую программу, например, так:

% tar -cv файл.tar . | gpg --encrypt

Эта команда создаёт несжатый tar-архив с содержимым текущего каталога, а затем пропускает тарбол через программу gpg, которая шифрует и сжимает архив, делая невозможным его чтение кем-либо, у кого нет вашего секретного ключа.

tar через ssh

Если компьютер-источник и целевой компьютер связаны по LAN или WAN, то для экономии времени можно комбинировать использование SSH (Secure Shell) и tar для архивирования, копирования и извлечения файлов за один раз. Вот как это делать:

$ (cd ~/stuff; tar --create --gzip --file - *) | \ ssh destination tar --extract --gunzip --file --verbose -C stuff

В этой команде выполняется сразу несколько действий. Давайте разберем ее:

    Последовательность команд, заключенных в круглых скобках, называют вложенной оболочкой - subshell. Изменения, сделанные в subshell-оболочке - например, изменение каталога, - не повлияют на команду в целом, а затронут только среду вложенной оболочки. Поэтому первая управляющая последовательность - (cd ~/stuff; tar –create –gzip –file - *) меняет текущий рабочий каталог на ~/stuff, а затем запускает tar. Так как за вложенной оболочкой следует перенаправление в канал, то все результаты работы subshell посылаются в следующую на очереди команду.

    Как и много других UNIX-утилит, tar может писать в стандартный поток вывода (stdout) и читать из стандартного потока ввода (stdin). И stdout и stdin обычно обозначаются дефисом (-). Поэтому команда –create –file - создает архив в stdout.

    Канал (|) передает все результаты работы subshell в утилиту ssh, которая, в свою очередь, передает все необходимые данные с исходного компьютера на удаленный.

    Наконец, удаленный компьютер запускает собственный экземпляр утилиты tar для извлечения данных из архива. Теперь –extract –file - считывает архив из стандартного потока ввода. Опция -C принуждает tar на целевом компьютере сменить текущий рабочий каталог на stuff, прежде чем начать какие-либо операции разархивирования. Конечным результатом работы этой команды в целом будет передача архива через ssh и распаковка его в ~/stuff.

Итак, с помощью одной команды архив был создан, передан и распакован. Кстати, слегка изменив эту команду, можно копировать архив с удаленного компьютера на локальный и разархивировать его. Вот команда, которую для этого надо выполнить на локальном компьютере:

$ ssh destination cat archive.tgz | \ (cd ~/stuff; tar --extract --gunzip --file -)

Архив на удаленном компьютере будет открыт, затем поток байтов из cat будет послан во вложенную оболочку, которая сменит рабочий каталог, а затем извлечет архив. (Добавление -C ~/stuff к команде tar приведет к тем же результатам; пример показывает только то, что subshell тоже могут работать со входными данными.)

tar exclude

–exclude pattern (-W exclude=pattern) Не обрабатывать файлы или директории, которые совпадают с указанным шаблоном. Учтите, что исключения имеют приоритет над шаблонами или именами файлов, указанных в командной строке.

    Пример: Из директории test при архивировании tar исключить поддиректорию.svn tar -czf test1.tar.gz --exclude=".svn" test/

    Пример: При архивировании текущей директории и сжатием Примеры использования gzip и gunzip , исключить файл с расширениями.tar.gz .iso .deb .py $ tar -czf test.tar.gz *.* --exclude="*.tar.gz" --exclude="*.iso" --exclude="*.deb" --exclude="*.zip" --exclude="*.py"

tar с сохранением прав доступа

Создать архив с сохранением прав доступа. Ключ -p, –preserve-permissions, –same-permissions извлекать информацию o правах доступа к файлу (по умолчанию для суперпользователя)

Tar -cvpf archive.tar.gz dir1

Распаковать архив с сохранением прав доступа

Tar -xvpf archive.tar.gz

tar распаковать в нужную директорию

Чтобы распаковать архив в нужную директорию используется ключ -С

# man tar ... -C directory In c and r mode, this changes the directory before adding the following files. In x mode, change directories after opening the archive but before extracting entries from the archive. ...

Например, пример проверен для FreeBSD:

# tar -xvf /usr/home/darkfire/backup.ns.server.254/usr/ports/distfiles.tar -C /usr/ports/

tar split разбить архив на несколько частей

Split -b 1000m distfiles.tar distfiles.split.tar

В итоге вы получите много файликов типа

Distfiles.split.taraa distfiles.split.tarab distfiles.split.tarai

100m означает 100 мегабайт. Можете написать 100k - это будет 100 киллобайт. Собрать обратно их можно вот так:

Cat distfiles.split.tar* | tar zxvf -

Утилита командной строки tar используется для работы с архивами в операционных системах на базе UNIX. С ее помощью можно архивировать данные и оптимизировать использование дискового пространства.

Создание и распаковка архивов

Создать

Создание выполняется с ключом c . Синтаксис следующий:

tar -c<опции> <новый архивный файл> <что сжимаем>

Пример создания:

tar -czvf archive.tar.gz /home/dmosk

* в данном примере будет создан архив archive.tar.gz домашней директории пользователя (/home/dmosk )
** где z — сжать архив в gzip (без этого параметра, tar не сжимает, а создает так называемый тарбол); c — ключ на создание архива; v — verbose режим, то есть с выводом на экран процесса (очень удобно для наблюдением за ходом работы, но в скриптах можно упустить); f — использовать файл (обязательно указываем, так как в большей степени работаем именно с файлами).

Распаковать

Распаковка выполняется с ключом x с синтаксисом:

tar -x<опции> <архивный файл>

Пример распаковки:

tar -xvf archive.tar.gz

Примеры

gz

Распаковка.gz файла:

tar -xvf archive.tar.gz

* при возникновении ошибки This does not look like a tar archive , можно воспользоваться командой gzip -d archive.tar.gz .

bz2

tar -xvjf archive.tar.bz2

* ключ j отвечает за работу с bz2.

Если система ругается на bzip2, значит нужно его установить:

yum install bzip2

apt-get install bzip2

pkg install bzip2

* соответственно, для CentOS (RPM based), Ubuntu (deb based), FreeBSD (BSD based).

Если видим ошибку tar: Unrecognized archive format , воспользуемся следующей командой:

bzip2 -d archive.tar.bz2

gzip

tar -xvzf archive.tar.gzip

* ключ z отвечает за работу с gzip.

tgz

Распаковывается, как gzip:

tar -xvzf archive.tgz

Распаковать в определенную папку

tar -C /home/user -xvf archive.tar.gz

* ключ -C используется для указания папки, куда необходимо распаковать файлы из архива.

Распаковка без вложенной папки

Такой способ можно использовать для распаковки в заранее подготовленный каталог. Будет некий эффект переименовывания каталога или аналог «Распаковать здесь»:

tar -C /home/admin/mytar -xvf admin.tar.gz --strip-components 1

* каталог /home/admin/mytar заранее должен быть создан; --strip-components 1 пропустит одну вложенную папку внутри архива.

Исключение файлов по маске

Если необходимо пропустить некоторые файлы, вводим команду с ключом --exclude:

tar -czvf archive.tar.gz /wwwsite --exclude="sess_*"

* в данном примере мы создадим архив archive.tar.gz , в котором не будет файлов, начинающихся на sess_ .

Описание ключей tar

Команды для действия

* нельзя использовать несколько вышеперечисленных ключей в одной команде.

Дополнительные опции

Ключ Описание
--atime-preserve Оставить прежнюю метку времени доступа для файла.
-b N Задать размер блока N x 512.
-C Смена каталога. По умолчанию, используется тот, в котором мы находимся.
--checkpoint Показать имена папок при чтении архивного файла.
-G Использование старого формата инкрементального резервирования при отображении или извлечения.
-g Использование нового формата инкрементального резервирования при отображении или извлечения.
-h Не дублировать символьные ссылки. Только файлы, на которые указывают эти симлинки.
-i Игнорировать блоки нулей.
-j Использование bzip2.
--ignore-failed-read Игнорировать не читаемые файлы.
-k При распаковке, существующие файлы не заменяются соответствующими файлами из архива.
-L N Смена магнитной ленты после N*1024 байт.
-m При извлечении игнорировать время модификации объекта.
-M Многотомные архивы.
-N DATE Сохранять только более новые файлы относительно DATE
-O Направление извлекаемого на стандартный вывод.
-p Извлечение защищенной информации.
-P Не отбрасывает начальный слэш (/) из имен.
-s Сортировка файлов при извлечении.
--preserve Аналогично -ps
--remove-files Удалить исходные файлы после добавления в архив.
--same-owner Сохранить владельца при извлечении.
--totals Вывод байт при создании архива.
-v Протоколирование действий — отображение списка объектов, над которыми происходит действие.
-V NAME Создание архива на томе с меткой NAME.
--version Показать версию tar.
-w Требовать подтверждения для каждого действия.
-W Проверка архива после записи.
--exclude FILE Исключить файл FILE.
-X FILE Исключить файлы FILE.
-Z Фильтрует архив с помощью compress.
-z Использование gzip.

* актуальный список опций можно получить командой man tar .

mob_info