lseek(2) изменяет файловое смещение, используемое при чтении/записи

ОБЗОР

#include <sys/types.h>
#include <unistd.h>

off_t lseek(int fd, off_t offset, int whence);

ОПИСАНИЕ

Функция lseek() устанавливает смещение в файловом дескрипторе fd в значение аргумента offset в соответствии с директивой whence, которая может принимать одно из следующих значений:
SEEK_SET
Установить смещение равным offset (в байтах).
SEEK_CUR
Установить смещение равным текущему положению плюс offset (в байтах).
SEEK_END
Установить смещение равным размеру файла плюс offset (в байтах).

Функция lseek() позволяет задавать смещение, которое будет находиться за существующим концом файла (но это не изменяет размер файла). Если позднее по этому смещению будут записаны данные, то последующее чтение в промежутке («дырке») от конца файла до этого смещения, будет возвращать нулевые байты ('\0'), пока в этот промежуток действительно не будут записаны данные.

Перемещения по данным файла и промежутки

Начиная с версии 3.1, в Linux поддерживаются следующие дополнительные значения whence:
SEEK_DATA
Подогнать файловое смещение к следующему расположению, большему или равному значению offset, по которому в файле есть данные. Если значение offset указывает на данные, то файловое смещение устанавливается в offset.
SEEK_HOLE
Подогнать файловое смещение к следующему промежутку, большему или равному значению offset. Если значение offset указывает в середину промежутка, то файловое смещение устанавливается в offset. Если перед offset нет промежутка, то файловое смещение подгоняется к концу файла (т.е., это скрытый промежуток, который есть в конце любого файла).

В обоих, показанных выше, случаях, lseek() завершится с ошибкой, если offset указывает за конец файла.

Эти операции позволяют приложениям отображать промежутки в разреженно выделенном файле. Это может быть полезно для таких приложений, как инструменты резервного копирования файлов, которые могут выиграть в месте при создании резервных копий и сохранить промежутки, если у них есть механизм их обнаружения.

Для поддержки этих операций промежуток представляется последовательностью нулей, которые (обычно) физически не занимают места на носителе. Однако файловая система может не сообщать о промежутках, поэтому эти операции — не гарантируемый механизм отображения пространства носителя в файл (более того, последовательность нулей, которая на самом деле была записана на носитель, может не посчитаться промежутком). В простейшей реализации, файловая система может поддержать эти операции так: при SEEK_HOLE всегда возвращать смещение конца файла, а при SEEK_DATA всегда возвращать значение offset (т.е., даже если расположение, указанное offset, является промежутком, это можно считать данными, состоящими из последовательности нулей).

Чтобы получить определения SEEK_DATA и SEEK_HOLE из <unistd.h>, нужно задать макрос тестирования свойств _GNU_SOURCE.

Операции SEEK_HOLE и SEEK_DATA поддерживаются следующими файловыми системами:

*
Btrfs (начиная с Linux 3.1)
*
OCFS (начиная с Linux 3.2)
*
XFS (начиная с Linux 3.5)
*
ext4 (начиная с Linux 3.8)
*
tmpfs (начиная с Linux 3.8)

ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ

При успешном выполнении lseek() возвращает получившееся в результате смещение в байтах от начала файла. При ошибке возвращается значение (off_t) -1 и в errno записывается код ошибки.

ОШИБКИ

EBADF
fd не является открытым файловым дескриптором.
EINVAL
Неправильное значение whence. Получается, что возвращаемое файловое смещение стало бы отрицательным или указывало бы за конец поверхности носителя.
EOVERFLOW
Результирующие файловое смещение не может быть представлено типом off_t.
ESPIPE
Значение fd связано с каналом, сокетом или FIFO.
ENXIO
Значение whence равно SEEK_DATA или SEEK_HOLE, и текущее файловое смещение указывает за конец файла.

СООТВЕТСТВИЕ СТАНДАРТАМ

POSIX.1-2001, POSIX.1-2008, SVr4, 4.3BSD.

Значения SEEK_DATA и SEEK_HOLE являются нестандартными расширениями, которые также есть в Solaris, FreeBSD и DragonFly BSD; их предложили включить в следующую редакцию POSIX (выпуск 8).

ЗАМЕЧАНИЯ

Описание взаимосвязи между файловыми дескрипторами, открытыми файловыми описаниями и файлами смотрите в open(2).

Некоторые устройства не могут выполнять смещения и в POSIX не указано какие устройства должны поддерживать lseek().

В Linux при использовании lseek() на терминальных устройствах возвращается ESPIPE.

Если вы будете конвертировать старый код, используйте вместо значений whence следующие макросы:

старое значениеновое значение
0SEEK_SET
1SEEK_CUR
2SEEK_END
L_SETSEEK_SET
L_INCRSEEK_CUR
L_XTNDSEEK_END

Заметим, что файловые дескрипторы, созданные через dup(2) или fork(2), используют общий указатель на текущее положение в файле, так что позиционирование в таких файлах может приводить к состязательности процессов.