Scroll to navigation

SET_MEMPOLICY(2) Руководство программиста Linux SET_MEMPOLICY(2)

ИМЯ

set_mempolicy - настраивает политику работы с памятью NUMA для процесса и его потомков

ОБЗОР

#include <numaif.h>

int set_mempolicy(int mode, unsigned long *nodemask,
                  unsigned long maxnode);

Компонуется при указании параметра -lnuma.

ОПИСАНИЕ

Вызов set_mempolicy() устанавливает политику работы с памятью NUMA для вызывающего процесса, которая определяется режимом политики и нулём или более узлами (задаются в аргументах mode, nodemask и maxnode).

Машина с NUMA имеет различные контроллеры памяти с различными расстояниями до определённых ЦП. Политикой памяти задаётся узел, на котором выделяется память для процесса.

Этот системный вызов устанавливает в процессе политику по умолчанию. Политика процесса управляет выделением страниц в адресном пространстве процесса из областей памяти, которые не контролируются специальной политикой, заданной с помощью mbind(2). Политикой процесса по умолчанию также контролируется выделение любых страниц для отображаемых в память файлов с помощью вызова mmap(2) с флагом MAP_PRIVATE (которые читаются (загружаются) только этим процессом) и для отображаемых в память файлов с помощью вызова mmap(2) с флагом MAP_SHARED (независимо от типа доступа). Эта политика применяется только когда процесс запрашивает выделение новой страницы. Для анонимной памяти это применяется, когда страница впервые затрагивается приложением.

В аргументе mode должно быть указано MPOL_DEFAULT, MPOL_BIND, MPOL_INTERLEAVE или MPOL_PREFERRED. Для всех режимов, за исключением MPOL_DEFAULT, в аргументе nodemask требуется указать один или более узлов.

Аргумент mode также может содержать необязательный флаг режима. Поддерживаемые флаги режима:

В аргументе nodemask указываются идентификаторы физических узлов. Linux не будет перераспределять nodemask, если процесс перемещается в другой контекст набора процессоров или когда изменяется набор узлов, который доступен процессу согласно текущему контексту набора процессоров.
В аргументе nodemask указываются идентификаторы узлов из набора идентификаторов узлов, разрешённых процессу текущим контекстом набора процессоров.

В nodemask указывается битовая маска идентификаторов узлов, которая может содержать до maxnode бит. Размер битовой маски округляется до следующего значение кратного sizeof(unsigned long), но ядро будет использовать биты только до maxnode. Значение NULL в nodemask или maxnode указывает на пустой набор узлов. Если значение maxnode равно нулю, то аргумент nodemask игнорируется.

Если требуется аргумент nodemask, то его значение должно содержать не менее одного работающего узла, разрешённого процессу из текущего контекста набора процессоров (если не указан флаг режима MPOL_F_STATIC_NODES) и имеющего память Если в mode установлен флаг MPOL_F_STATIC_NODES и требуемое значение nodemask не содержит узлов, разрешённых процессу из текущего контекста набора процессоров, то политика памяти возвращается обратно к локальному выделению. Это эффективно заменяет указанную политику до тех пор, пока в текущий контекст набора процессоров процесса не добавится один или более узлов, указанных nodemask.

Режим MPOL_DEFAULT устанавливает, что любые политики памяти процесса, не равные политике по умолчанию, будут удалены, и политика памяти «вернётся» к системной политике по умолчанию. Системная политика по умолчанию — это «локальное выделение», то есть выделение памяти на узле с ЦП, на котором возник запрос выделения. Значение nodemask должно быть равно NULL. Если на «локальном узле» нет свободной памяти, то система попытается выделить память на «ближайшем» узле.

Режим MPOL_BIND устанавливает жёсткую политику, при которой выделение памяти выполняется только на узлах, заданных в nodemask. Если в nodemask указано более одного узла, то выделение страниц начнётся с узла с меньшим номером идентификатора и будет выполняться до тех пор, пока на нём не кончится свободная память. Затем выделение продолжится на узле со следующим большим номером идентификатора, указанного в nodemask, и т.д. до тех пор, пока на всех указанных узлах не закончится свободная память. Страницы не будут выделяться на узлах, не указанных в nodemask.

В режиме MPOL_INTERLEAVE выделение страниц чередуется между узлами, указанными в nodemask, согласно порядку номеров идентификаторов узлов. При этом происходит оптимизация полосы пропускания, а не задержки, так как происходит рассеивание страниц и доступ к этим страницам памяти, разносится по нескольким узлам. Однако доступ к отдельной странице по прежнему ограничен шириной канала с памятью на отдельном узле.

В режиме MPOL_PREFERRED задаётся предпочтительный узел для выделения памяти. Ядро будет пытаться сначала выделить страницы на этом узле и только после того как на предпочтительном узле не хватит памяти, попробует использовать «ближайшие» узлы. Если в nodemask указано более одного идентификатора узла, то в качестве предпочтительного будет использован первый узел из маски. Если в аргументах nodemask и maxnode указан пустой набор, то политике предписывается использовать «локальное выделение» (как при системной политике по умолчанию, описанной ранее).

Политика памяти процесса сохраняется при вызове execve(2) и наследуется дочерними процессами, созданными с помощью fork(2) или clone(2).

ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ

При успешном выполнении set_mempolicy() возвращается 0; при ошибке возвращается -1, а в errno содержится код ошибки.

ОШИБКИ

Часть всего диапазона памяти, заданная в nodemask и maxnode, указывает за пределы доступного адресного пространства.
Некорректное значение mode. Или значение mode равно MPOL_DEFAULT и значение nodemask не пусто, или mode равно MPOL_BIND или MPOL_INTERLEAVE и значение nodemask пусто. Или значение maxnode больше чем количество значимых бит страницы. Или в nodemask указан один или более идентификаторов узлов, значения которых больше чем максимальный поддерживаемый идентификатор узла. Или ни один из идентификаторов узлов, указанных в nodemask, не работает или не разрешены для текущего набора контекста процесса, или ни один из узлов не содержит памяти. Или в аргументе mode указаны MPOL_F_STATIC_NODES и MPOL_F_RELATIVE_NODES одновременно.
Недостаточное количество памяти ядра.

ВЕРСИИ

Системный вызов set_mempolicy() был добавлен в ядро Linux версии 2.6.7.

СООТВЕТСТВИЕ СТАНДАРТАМ

Данный вызов есть только в Linux.

ЗАМЕЧАНИЯ

Политика процесса не запоминается, если страница помещается в пространство подкачки. Когда страница возвращается в основную память, будет использована политика процесса или диапазона памяти, действующая на момент выделения страницы.

Информация о библиотеке доступна в numa(7).

СМОТРИТЕ ТАКЖЕ

get_mempolicy(2), getcpu(2), mbind(2), mmap(2), numa(3), cpuset(7), numa(7), numactl(8)

2008-08-15 Linux