symlink(7) работа с символьными ссылками

ОПИСАНИЕ

Символьные ссылки — это файлы, которые служат указателями на другие файлы. Чтобы понять их работу, сперва вы должны понять как работают жёсткие ссылки.

Жёсткая ссылка на файл не отличима от оригинального файла, так как это ссылка на объект, на который указывает оригинальное имя файла (более точно: каждая из жёстких ссылок на файл — это ссылка на один номер inode, где номер inode — индекс в таблице inode, в которой содержатся метаданные о всех файлах файловой системы; смотрите stat(2)). Изменения файла не зависят от используемого при этом имени файла. Жёсткие ссылки не могут указывать на каталоги (чтобы не возникало петель в дереве файловой системы, что могло бы привести к неправильной работе многих программ) и на файлы из разных файловых систем (так как номера inode не уникальны в файловых системах).

Символьная ссылка — это специальный тип файла, чьё содержимое представляет собой строку, содержащую имя другого файла — файла, на который указывает ссылка (содержимое символьной ссылки можно прочитать с помощью readlink(2)). Другими словами, символьная ссылка — это указатель на другое имя, а не на сам объект. В следствии этого, символьные ссылки могут указывать на каталоги и могут указывать на файлы в разных файловых системах.

Объект с именем, на которое ссылается символьная ссылка, может не существовать. Символьную ссылку, указывающую на не существующее имя, называют оборванной ссылкой (dangling link).

Поскольку символьная ссылка и объект, на который она ссылается, сосуществуют в пространство имён файловой системы, можно запутаться при различении самой ссылки и объекта, на который она ссылается. Старые системы, команды и системные вызовы имели собственные соглашения о ссылках, специально для этого созданные. Здесь в общих чертах описаны правила, которые одинаково реализованы в Linux и других системах. Важно, чтобы локальное приложение также соответствовало этим правилам, и пользовательский интерфейс был максимально одинаков.

Владельцы, права и отметки времени символьных ссылок

Владельца и группу существующей символьной ссылки можно изменить с помощью lchown(2). Владельцы символьной ссылки учитываются только, когда символьная ссылка удаляется или переименовывается в каталоге, на котором установлен бит закрепления (sticky bit) (смотрите stat(2)).

Время последнего обращения и изменения символьной ссылки можно изменять с помощью utimensat(2) или lutimes(3).

В Linux права на символьную ссылку не учитываются при любых операциях; права всегда имеют значение 0777 (чтение, запись и исполнение для всех категорий пользователей) и его нельзя изменить.

Получение файлового дескриптора, который указывает на символьную ссылку

Для работы с самой символьной ссылкой (а не файлом, на который она указывает) нужно указать комбинацию флагов O_PATH и O_NOFOLLOW вызов open(2) вернёт файловый дескриптор, который можно передавать в аргументе dirfd в такие системные вызовы как fstatat(2), fchownat(2), fchmodat(2), linkat(2) и readlinkat(2).

По умолчанию (т. е., если не указан флаг AT_SYMLINK_FOLLOW), если name_to_handle_at(2) вызывается для символьной ссылки, то он возвращает описатель символьной ссылки (а не файла, на который она указывает). Затем с его помощью можно получить файловый дескриптор символьной ссылки (а не файла, на который она указывает), указав флаг O_PATH в последующем вызове open_by_handle_at(2). Данный файловый дескриптор можно использовать в вышеупомянутых системных вызовах для работы с самой символьной ссылкой.

Трактовка символьных ссылок в системных вызовах и командах

При работе с символьными ссылками можно воздействовать на сами символьные ссылки или на объекты, на которые они указывают. В последнем случае про приложение или системный вызов говорят, что он переходит (follow) по ссылке. Символьные ссылки могут указывать на другие символьные ссылки; в этом случае ссылки разыменовываются до нахождения объекта, который не является символьной ссылкой, символьной ссылки, которая указывает на несуществующий файл, или до обнаружения зацикливания (обнаружение зацикливания выполняется заданием максимального количества переходов по ссылкам, при превышении которого возвращается ошибка).

Есть три области, которые требуют обсуждения:

1.
Использование символьных ссылок в виде имён файлов в аргументах системных вызовов.
2.
Символьные ссылки, указываемые в аргументах командной строки утилит, которые не выполняют обход дерева файлов.
3.
Символьные ссылки, встреченные утилитами при обходе дерева файлов (задаваемые в командной строке или встреченные как часть файла при обходе иерархии).

Системные вызовы

Рассмотрим использование символьных ссылок в виде имён файлов в аргументах системных вызовов.

За исключениями, описанными ниже, все системные вызовы переходят по символьным ссылкам. Например, если есть символьная ссылка slink, которая указывает на файл с именем afile, то системный вызов open("slink" ...) вернёт файловый дескриптор, ссылающийся на файл afile.

Некоторые системные вызовы не переходят по ссылкам, а работают с самими ссылками: lchown(2), lgetxattr(2), llistxattr(2), lremovexattr(2), lsetxattr(2), lstat(2), readlink(2), rename(2), rmdir(2) и unlink(2).

Другие системные вызовы могут переходить по ссылкам: faccessat(2), fchownat(2), fstatat(2), linkat(2), name_to_handle_at(2), open(2), openat(2), open_by_handle_at(2) и utimensat(2); подробности смотрите в их справочных страницах. Так как remove(3) является псевдонимом unlink(2), библиотечная функция также не переходит по символьным ссылкам. При указании символьной ссылки rmdir(2) вызов завершается с ошибкой ENOTDIR.

Вызов link(2) заслуживает отдельного описания. В POSIX.1-2001 говорится, что link(2) должен разыменовывать oldpath, если это символьная ссылка. Однако в Linux этого не делается (по умолчанию Solaris делается тоже самое, но в POSIX.1-2001 определяется как такое поведение можно получить с помощью специальных параметров компилятора). В POSIX.1-2008 изменено описание, которое позволяет реализовывать любое из этих вариантов поведения.

Команды, не выполняющие обход дерева файлов

Рассмотрим случай с символьными ссылками, указываемыми в аргументах командной строки утилит, которые не выполняют обход дерева файлов.

За исключением, описанным далее, команды переходят по ссылкам, указанным в аргументах командной строки. Например, если slink — символьная ссылка, которая указывает на файл с именем afile, то команда cat slink выведет содержимое файла afile.

Важно понимать, что это правило учитывается командами, которые не обязательно выполняют обход дерева файлов; например, команда chown file следует этому правилу, а команда chown -R file, выполняющая обход дерева, нет (последняя описана далее).

Если команде явно указано воздействовать на символьную ссылку, а не переходить по символьной ссылке, например, требуется, чтобы chown slink изменила права на файл slink, независимо от того, является ли он символьной ссылкой или нет, то нужно использовать параметр -h. В примере выше chown root slink изменяет права на файл, на который указывает slink, а chown -h root slink изменяет права на саму ссылку slink.

Есть несколько исключений из этого правила:

*
Команды mv(1) и rm(1) не переходят по символьным ссылкам, указанным в аргументах, а пытаются переименовать и удалить их (заметим, если символьная ссылка указывает на файл через относительный путь, то перемещение файла в другой каталог с большой вероятностью вызовет проблемы, так как путь может оказаться неправильным).
*
Команда ls(1) также является исключением из этого правила. Для совместимости со старыми системами (когда ls(1) не делает обход дерева, то есть не указан параметр -R), команда ls(1) переходит по символьным ссылкам, указанным в аргументах, если задан параметр -H или -L, или если не указан параметр -F, -d или -l (команда ls(1) — единственная команда, у которой параметры -H и -L влияют на поведение даже когда не выполняется обход дерева файлов).
*
Команда file(1) также является исключением из этого правила. По умолчанию file(1) не переходит по символьной ссылке, указанной в аргументе. Команда file(1) переходит по символьной ссылке, указанной в аргументе, если указан параметр -L.

Команды, выполняющие обход дерева файлов

Следующие команды могут или всегда обходят дерево файлов: chgrp(1), chmod(1), chown(1), cp(1), du(1), find(1), ls(1), pax(1), rm(1) и tar(1).

Важно понимать, что следующие правила применяются как к символьным ссылкам, обнаруженным при обходе дерева файлов, так и к символьным ссылкам, указанным в аргументах командной строки.

Первое правило применяется к символьным ссылкам, которые указывают на файлы, а не на каталоги. Операции, которые применимы к символьным ссылкам, выполняются с самими ссылками, но другие ссылки игнорируется.

Команда rm -r slink каталог удалит slink, а также все символьные ссылки, обнаруженные при обходе каталога, так как символьные ссылки могут быть удалены. Команда rm(1) никогда не удаляет файл, на который указывает slink.

Второе правило применяется к символьным ссылкам, которые указывают на каталоги. По умолчанию такие символьные ссылки никогда не разыменовываются. Часто об этом говорят как о «физическом» обходе, в противовес «логическому» обходу (когда выполняется переход по символьным ссылкам, указывающем на каталог).

При обходе дерева файлов командами соблюдаются (должны) определённые соглашения, если это возможно:

*
Команду можно заставить перейти по любой символьной ссылке, указанной в командной строке, независимо от типа файла, на который она ссылаются, указав параметр -H (от «half-logical»). Этот параметр заставляет пространство имён командной строки выглядеть как логическое пространство имён (заметим, что команды, которые не всегда делают обход дерева файлов, будут игнорировать флаг -H, если также не указан флаг -R).

Например, команда chown -HR user slink выполнит обход файловой иерархии с корнем как у файла, указанном slink. Заметим, что здесь -H делает не тоже самое, что и флаг -h, описанный ранее. При флаге -H символьные ссылки, указанные в командной строке, будут разыменовываться и при обходе файлового дерева и как если бы пользователь указал имя файла, на которое указывает символьная ссылка.

*
Команду можно заставить перейти по любой символьной ссылке, указанной в командной строке, а также по всем символьным ссылкам, встреченным при обходе, независимо от типа файла, на который она ссылается, указав параметр -H (от «half-logical»). Этот параметр заставляет всё пространство имён выглядеть как логическое пространство имён (заметим, что команды, которые не всегда делают обход дерева файлов, будут игнорировать флаг -L, если также не указан флаг -R).

Например, команда chown -LR user slink изменит владельца файла, на который указывает slink. Если slink указывает на каталог, то chown обойдёт дерево файлов с корнем в этом каталоге. Также, если символьные ссылки встречаются в любом файловом дереве, которое обходит chown, то с ними будет сделано тоже что и с slink.

*
Команду можно заставить следовать поведению по умолчанию, указав флаг -P (от «physical»). Этот флаг предназначен для работы со всем пространством имён как с физическим пространством имён.

Команды, которые по умолчанию не выполняют обход дерева файлов, игнорируют флаги -H, -L и -P, если не указан флаг -R. Также вы можете указать параметры -H, -L и -P более одного раза; последний указанный параметр определяет поведение команды. Это позволяет создавать псевдонимы команд с некоторым поведением, а затем переопределять это поведение в командной строке.

У команд ls(1) и rm(1) есть исключения из этих правил:

*
Команда rm(1) работает с символьными ссылками, а не с файлами, на который они ссылаются, и поэтому никогда не переходит по символьной ссылке. Команда rm(1) не поддерживает параметры -H, -L и -P.
*
Для совместимости со старыми системами работа команды ls(1) чуть отличается. Если не указан параметр -F, -d или -l, то ls(1) переходит по символьной ссылке, указанной в командной строке. Если указан флаг -L, то ls(1) переходит по всем символьным ссылкам независимо от их типа и где они встретились — в командной строке или при обходе дерева.