set_mempolicy(2) настраивает политику работы с памятью NUMA для потока и его

ОБЗОР

#include <numaif.h>


long set_mempolicy(int mode, const unsigned long *nodemask,
unsigned long maxnode);


Компонуется при указании параметра -lnuma.

ОПИСАНИЕ

Вызов set_mempolicy() устанавливает политику работы с памятью NUMA для вызывающей нити, которая определяется режимом политики и нулём или более узлами (задаются в аргументах mode, nodemask и maxnode).

Машина с NUMA имеет различные контроллеры памяти с различными расстояниями до определённых ЦП. Политикой памяти задаётся узел, на котором выделяется память для нити.

Этот системный вызов устанавливает в нити политику по умолчанию. Политика нити управляет выделением страниц в адресном пространстве процесса из областей памяти, которые не контролируются специальной политикой, заданной с помощью mbind(2). Политикой нити по умолчанию также контролируется выделение любых страниц для отображаемых в память файлов с помощью вызова mmap(2) с флагом MAP_PRIVATE (которые читаются (загружаются) только этой нитью) и для отображаемых в память файлов с помощью вызова mmap(2) с флагом MAP_SHARED (независимо от типа доступа). Эта политика применяется только когда нить запрашивает выделение новой страницы. Для анонимной памяти это применяется, когда страница впервые затрагивается приложением.

В аргументе mode должно быть указано MPOL_DEFAULT, MPOL_BIND, MPOL_INTERLEAVE или MPOL_PREFERRED. Для всех режимов, за исключением MPOL_DEFAULT, в аргументе nodemask требуется указать один или более узлов.

Аргумент mode также может содержать необязательный флаг режима. Поддерживаемые флаги режима:

MPOL_F_STATIC_NODES (начиная с Linux 2.6.26)
В аргументе nodemask указываются идентификаторы физических узлов. Linux не будет перераспределять nodemask, если процесс перемещается в другой контекст набора процессоров или когда изменяется набор узлов, который доступен процессу согласно текущему контексту набора процессоров.
MPOL_F_RELATIVE_NODES (начиная с Linux 2.6.26)
В аргументе nodemask указываются идентификаторы узлов из набора идентификаторов узлов, разрешённых процессу текущим контекстом набора процессоров.

В nodemask указывается битовая маска идентификаторов узлов, которая может содержать до maxnode бит. Размер битовой маски округляется до следующего значение кратного sizeof(unsigned long), но ядро будет использовать биты только до maxnode. Значение NULL в nodemask или maxnode указывает на пустой набор узлов. Если значение maxnode равно нулю, то аргумент nodemask игнорируется.

Если требуется аргумент nodemask, то его значение должно содержать не менее одного работающего узла, разрешённого процессу из текущего контекста набора процессоров (если не указан флаг режима MPOL_F_STATIC_NODES) и имеющего память Если в mode установлен флаг MPOL_F_STATIC_NODES и требуемое значение nodemask не содержит узлов, разрешённых процессу из текущего контекста набора процессоров, то политика памяти возвращается обратно к локальному выделению. Это эффективно заменяет указанную политику до тех пор, пока в текущий контекст набора процессоров процесса не добавится один или более узлов, указанных nodemask.

Режим MPOL_DEFAULT устанавливает, что любые политики памяти нити, не равные политике по умолчанию, будут удалены, и политика памяти «вернётся» к системной политике по умолчанию. Системная политика по умолчанию — это «локальное выделение», то есть выделение памяти на узле с ЦП, на котором возник запрос выделения Значение nodemask должно быть равно NULL. Если на «локальном узле» нет свободной памяти, то система попытается выделить память на «ближайшем» узле.

Режим MPOL_BIND устанавливает жёсткую политику, при которой выделение памяти выполняется только на узлах, заданных в nodemask. Если в nodemask указано более одного узла, то выделение страниц начнётся с узла с меньшим номером идентификатора и будет выполняться до тех пор, пока на нём не кончится свободная память. Затем выделение продолжится на узле со следующим большим номером идентификатора, указанного в nodemask, и т.д. до тех пор, пока на всех указанных узлах не закончится свободная память. Страницы не будут выделяться на узлах, не указанных в nodemask.

В режиме MPOL_INTERLEAVE выделение страниц чередуется между узлами, указанными в nodemask, согласно порядку номеров идентификаторов узлов. При этом происходит оптимизация полосы пропускания, а не задержки, так как происходит рассеивание страниц и доступ к этим страницам памяти, разносится по нескольким узлам. Однако доступ к отдельной странице по прежнему ограничен шириной канала с памятью на отдельном узле.

В режиме MPOL_PREFERRED задаётся предпочтительный узел для выделения памяти. Ядро будет пытаться сначала выделить страницы на этом узле и только после того как на предпочтительном узле не хватит памяти, попробует использовать «ближайшие» узлы. Если в nodemask указано более одного идентификатора узла, то в качестве предпочтительного будет использован первый узел из маски. Если в аргументах nodemask и maxnode указан пустой набор, то политике предписывается использовать «локальное выделение» (как при системной политике по умолчанию, описанной ранее).

Политика памяти нити сохраняется при вызове execve(2) и наследуется дочерними нитями, созданными с помощью fork(2) или clone(2).

ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ

При успешном выполнении set_mempolicy() возвращается 0; при ошибке возвращается -1, а в errno содержится код ошибки.

ОШИБКИ

EFAULT
Часть всего диапазона памяти, заданная в nodemask и maxnode, указывает за пределы доступного адресного пространства.
EINVAL
Некорректное значение mode. Или значение mode равно MPOL_DEFAULT и значение nodemask не пусто, или mode равно MPOL_BIND или MPOL_INTERLEAVE и значение nodemask пусто. Или значение maxnode больше чем количество значимых бит страницы. Или в nodemask указан один или более идентификаторов узлов, значения которых больше чем максимальный поддерживаемый идентификатор узла. Или ни один из идентификаторов узлов, указанных в nodemask, не работает или не разрешены для текущего набора контекста процесса, или ни один из узлов не содержит памяти. Или в аргументе mode указаны MPOL_F_STATIC_NODES и MPOL_F_RELATIVE_NODES одновременно.
ENOMEM
Недостаточное количество памяти ядра.

ВЕРСИИ

Системный вызов set_mempolicy() был добавлен в ядро Linux версии 2.6.7.

СООТВЕТСТВИЕ СТАНДАРТАМ

Данный вызов есть только в Linux.

ЗАМЕЧАНИЯ

Политика памяти не запоминается, если страница помещается в пространство подкачки. Когда страница возвращается в основную память, будет использована политика нити или диапазона памяти, действующая на момент выделения страницы.

Информация о библиотеке доступна в numa(7).