Scroll to navigation

MMAP(2) Руководство программиста Linux MMAP(2)

ИМЯ

mmap, munmap - отображает файлы или устройства в памяти, или удаляет их отображение

ОБЗОР

#include <sys/mman.h>

void *mmap(void *addr, size_t length, int prot, int flags,
           int fd, off_t offset);
int munmap(void *addr, size_t length);

ОПИСАНИЕ

Вызов mmap() создаёт новое отображение в виртуальном адресном пространстве вызывающего процесса. Адрес начала нового отображения указывается в addr. В аргументе length задаётся длина отображения.

Если значение addr равно NULL, то ядро само выбирает адрес, по которому создаётся отображение; это наиболее переносимый метод создания нового отображения. Если значение addr не равно NULL, то ядро учитывает это при размещении отображения; в Linux отображение будет создано в странице ближайшей к границе. Адрес нового отображения возвращается как результат вызова.

Содержимое файлового отображения (в отличие от анонимного отображения; см. MAP_ANONYMOUS далее) инициализируется данными из файла (или объекта), на который указывает файловый дескриптор fd, длиной length байт, начиная со смещения offset. Значение offset должно быть кратно размеру (возвращается sysconf(_SC_PAGE_SIZE)) страницы.

В аргументе prot указывается желаемая защита памяти отображения (не должна конфликтовать с режимом открытого файла). Значением может быть PROT_NONE или побитово сложенные (OR) следующие флаги:

Страницы доступны для исполнения.
Страницы доступны для чтения.
Страницы доступны для записи.
Страницы недоступны.

В аргументе flags задаётся будут ли изменения отображения видимы другим процессам, отображающим ту же область, и будут ли изменения перенесены в отображённый файл. Данное поведение определяется в flags одним из следующих значений:

Использовать это отображение совместно с другими процессами. Изменения отображения видимы другим процессам, которые отображают тот же файл, а также изменяется содержимое самого файла. Файл может оставаться не обновлённым до запуска вызова msync(2) или munmap().
Создать закрытое отображение с механизмом копирования при записи. Изменения отображения невидимы другим процессам, отображающим тот же файл, и сам файл не изменяется. Не определено, будут ли видимы в отображённой области изменения в файле, сделанные после вызова mmap().

Эти флаги описаны в POSIX.1-2001.

Кроме этого в flags могут быть указаны (побитовым сложением):

Поместить отображение в первые 2ГБ адресного пространства процесса. Этот флаг поддерживается только на x86-64 для 64-битных программ. Он был добавлен для размещения стеков нитей в первых 2ГБ памяти, что даёт увеличение производительности при переключения контекста на некоторых первых 64-битных процессорах. В современных процессорах x86-64 такой проблемы с производительностью больше нет, поэтому на таких системах данный флаг больше не требуется. Он игнорируется, если указан флаг MAP_FIXED.
Синоним MAP_ANONYMOUS. Устарел.
Отображение не связано с каким-либо файлом; его содержимое инициализируется нулями. Аргументы fd и offset игнорируются; однако в некоторых реализациях при указании MAP_ANONYMOUS (или MAP_ANON) требуется указывать fd равное -1, и так нужно поступать для переносимости приложений. Использование MAP_ANONYMOUS вместе с MAP_SHARED поддерживается в Linux начиная с ветви 2.4.
Этот флаг игнорируется. Раньше он обозначал, что попытки записи в подчинённые файлы должны завершаться с кодом ошибки ETXTBUSY. Но это стало основой для атак типа отказа в обслуживании.
Этот флаг игнорируется.
Флаг для совместимости, игнорируется.
Не просто учитывать адрес addr, а помещать отображение точно по этому адресу. Значение addr должно быть кратно размеру страницы. Если область памяти, указанная addr и len, перекрывается со страницами существующих отображений, то перекрывающаяся часть существующих отображений будет отброшена. Если заданный адрес не может быть использован, то вызов mmap() завершится с ошибкой. Так как требование постоянного адреса для отображения менее переносимо, использовать этот флаг не рекомендуется.
Используется для стеков. Для виртуальной системы памяти ядра обозначает, что отображение должно распространяться вниз по памяти.
Выделять отображение используя «огромные страницы». Дополнительную информацию смотрите в файле исходного кода ядра Documentation/vm/hugetlbpage.txt.
Блокировать страницы отображённой области в памяти так, как это делает mlock(2). Этот флаг игнорируется в старых ядрах.
Имеет смысл только вместе с MAP_POPULATE. Не выполнять упреждающее чтение: только создать записи в таблице страниц для страниц, которые уже есть ОЗУ. Начиная с Linux 2.6.23 этот флаг приводит к тому, что выполнение работы MAP_POPULATE отменяется. Когда-нибудь комбинация MAP_POPULATE и MAP_NONBLOCK может быть реализована заново.
Не резервировать страницы пространства подкачки для этого отображения. Если пространство подкачки резервируется, то для отображения гарантируется возможность изменения. Если оно не резервируется, то можно получить сигнал SIGSEGV при записи, если физическая память будет недоступна. Смотрите также описание файла /proc/sys/vm/overcommit_memory в proc(5). В ядрах до 2.6 этот флаг действовал только для частных доступных на запись отображений.
Наполнить (до возникновения страничного прерывания, prefault) страничные таблицы отображения. Для файлового отображения это приводит к опережающему чтению из файла. Последующий доступ к отображению не будет блокирован в ожидании обработки страничного прерывания. Флаг MAP_POPULATE поддерживается только для закрытых отображений начиная с Linux 2.6.23.
Разместить отображение по адресу, пригодному для процесса или для стека нити. В настоящее время для этого флага не выполняются какие-либо действия, но он используется для реализации нитей в glibc; если на какой-то архитектуре потребуются специальные действия по выделению стека, то позже их поддержка может быть прозрачно добавлена в glibc.
Не очищать анонимные страницы. Этот флаг предназначен для повышения производительности на встраиваемых устройствах. Он учитывается, только если ядро было собрано с поддержкой параметра CONFIG_MMAP_ALLOW_UNINITIALIZED. Так как этот параметр может привести к нарушению безопасности, обычно он устанавливается только на встраиваемых устройствах (то есть, устройствах, где только один человек имеет полный контроль над содержимым пользовательской памяти).

Из флагов, перечисленных выше, в POSIX.1-2001 определён только MAP_FIXED. Однако, большинство систем также поддерживают MAP_ANONYMOUS (или его синоним — MAP_ANON).

В некоторых системах описаны дополнительные флаги: MAP_AUTOGROW, MAP_AUTORESRV, MAP_COPY и MAP_LOCAL.

Память, отображённая с помощью mmap(), сохраняется при fork(2) с теми же атрибутами.

Файл отображается по кратному размеру страницы. Для файла, который не кратен размеру страницы, оставшаяся память при отображении заполняется нулями, и запись в эту область не приводит к изменению файла. Действия при изменении размера отображаемого файла на страницы, которые соответствуют добавленным или удалённым областям файла, не определены.

munmap()

Системный вызов munmap() удаляет отображение для указанного адресного диапазона и это приводит к тому, что дальнейшее обращение по адресам внутри диапазона приводит к генерации неправильных ссылок на память. Также для диапазона отображение автоматически удаляется при завершении работы процесса. С другой стороны, закрытие файлового дескриптора не приводит к удалению отображения диапазона.

Адрес addr должен быть кратен размеру страницы. Все страницы, содержащие часть указанного диапазона, удаляются из отображения и последующие ссылки на эти страницы приводят к генерации сигнала SIGSEGV. Это не ошибка, если указанный диапазон не содержит каких-либо отображённых страниц.

Изменение временных отметок для отображённых файлов

У отображённых файлов поле st_atime может измениться в любой момент между вызовом mmap() и соответствующим удалением отображения; первое обращение к отображённой странице приведёт к обновлению поля, если это ещё не было сделано.

Поля st_ctime и st_mtime у отображённого с помощью флагов PROT_WRITE и MAP_SHARED файла будут обновлены после записи отображённой области и перед последующим вызовом msync(2) с флагом MS_SYNC или MS_ASYNC, если он будет вызван.

ВОЗВРАЩАЕМОЕ ЗНАЧЕНИЕ

При успешном выполнении mmap() возвращается указатель на отображённую область. При ошибке возвращается значение MAP_FAILED (а именно, (void *) -1) и errno устанавливается в соответствующее значение. При успешном выполнении munmap() возвращается 0; при ошибке возвращается -1 и устанавливается errno (скорее всего, в EINVAL).

ОШИБКИ

Файловый дескриптор указывает на не обычный файл. Или был указан флаг MAP_PRIVATE, но fd не открыт на чтение. Или был указан флаг MAP_SHARED и установлен бит PROT_WRITE, но fd не открыт в режиме чтения/записи (O_RDWR). Или был указан флаг PROT_WRITE, но файл доступен только для дополнения.
Файл заблокирован, или блокируется слишком много памяти (см. setrlimit(2)).
Значение fd не является правильным файловым дескриптором (и MAP_ANONYMOUS не установлен).
Неправильное значение addr, length или offset (например, оно либо слишком велико, либо не выровнено по границе страницы).
(начиная с Linux 2.6.12) Значение length равно 0.
Значение flags не содержит MAP_PRIVATE или MAP_SHARED, или содержит сразу эта эти флага.
Достигнуто максимальное количество открытых файлов в системе.
Используемая файловая система для указанного файла не поддерживает отображение памяти.
Недостаточно памяти, или было превышено максимальное число отображений процесса.
Аргументом prot запрашивается PROT_EXEC, но отображённая область принадлежит файлу на файловой системе, которая смонтирована с флагом no-exec.
Был задан флаг MAP_DENYWRITE, но объект, указываемый fd, открыт на запись.

При использовании отображаемой области памяти могут возникать следующие сигналы:

Попытка записи в область, отображённую только для чтения.
Попытка доступа к части буфера, которая не совпадает файлом (например, она может находиться за пределами файла. Подобной является ситуация, когда другой процесс уменьшил длину файла).

СООТВЕТСТВИЕ СТАНДАРТАМ

SVr4, 4.4BSD, POSIX.1-2001.

ДОСТУПНОСТЬ

В системах POSIX, в которых есть вызовы mmap(), msync(2) и munmap(), значение _POSIX_MAPPED_FILES, определённое в <unistd.h>, больше 0 (смотрите также sysconf(3)).

ЗАМЕЧАНИЯ

В данной странице описывается интерфейс, предоставляемый обёрточной функцией glibc mmap(). Раньше, эта функция обращалась к системному вызову с тем же именем. Начиная с ядра 2.4, данный системный вызов был заменён на mmap2(2). В настоящее время обёрточная функция glibc, mmap(), вызывает mmap2(2) с подходящим подкорректированным значением offset.

На некоторых архитектурах (например, i386), флаг PROT_WRITE подразумевает флаг PROT_READ. Также от архитектуры зависит подразумевает ли PROT_READ флаг PROT_EXEC или нет. Переносимые программы должны всегда устанавливать PROT_EXEC, если они собираются выполнять код, находящийся в отображении.

Переносимый способ создания отображения: указать в addr значение 0 (NULL) и убрать MAP_FIXED из flags. В этом случае, система сама выберет адрес для отображения; адрес, выбранный таким образом, не будет будет конфликтовать с существующими отображениями и не будет равен 0. Если указан флаг MAP_FIXED и значение addr равно 0 (NULL), то адрес отображения будет равен 0 (NULL).

ДЕФЕКТЫ

В Linux не гарантируется результат, описанный выше у флага MAP_NORESERVE. По умолчанию, любой процесс может быть принудительно завершён в любой момент, если в системе закончилась память.

В ядрах до версии 2.6.7 флаг MAP_POPULATE учитывается только, если указано значение prot равное PROT_NONE.

В SUSv3 указано, что mmap() должен завершаться с ошибкой, если length равно 0. Однако в ядрах до версии 2.6.12 вызов mmap() в этом случае выполняется успешно: отображение не создаётся и вызов возвращает addr. Начиная с ядра версии 2.6.12, в этом случае вызов mmap() завершается с ошибкой EINVAL.

ПРИМЕР

Следующая программа выводит часть файла, указанного в первом аргументе командной строки, в стандартный вывод. Диапазон выдаваемых байт задаётся смещением и длиной во втором и третьем аргументах командной строки. Программа создаёт отображение требуемых страниц файла и затем использует write(2) для вывода запрошенных байт.

#include <sys/mman.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#define handle_error(msg) \

do { perror(msg); exit(EXIT_FAILURE); } while (0) int main(int argc, char *argv[]) {
char *addr;
int fd;
struct stat sb;
off_t offset, pa_offset;
size_t length;
ssize_t s;
if (argc < 3 || argc > 4) {
fprintf(stderr, "%s файл смещение [длина]\n", argv[0]);
exit(EXIT_FAILURE);
}
fd = open(argv[1], O_RDONLY);
if (fd == -1)
handle_error("open");
if (fstat(fd, &sb) == -1) /* получение размера файла */
handle_error("fstat");
offset = atoi(argv[2]);
pa_offset = offset & ~(sysconf(_SC_PAGE_SIZE) - 1);
/* для mmap() нужно выронить смещение */
if (offset >= sb.st_size) {
fprintf(stderr, "указанное смещение находится за концом файла\n");
exit(EXIT_FAILURE);
}
if (argc == 4) {
length = atoi(argv[3]);
if (offset + length > sb.st_size)
length = sb.st_size - offset;
/* Нельзя показать байты за концом файла */
} else { /* Не указана длина ==> показать всё до конца файла */
length = sb.st_size - offset;
}
addr = mmap(NULL, length + offset - pa_offset, PROT_READ,
MAP_PRIVATE, fd, pa_offset);
if (addr == MAP_FAILED)
handle_error("mmap");
s = write(STDOUT_FILENO, addr + offset - pa_offset, length);
if (s != length) {
if (s == -1)
handle_error("write");
fprintf(stderr, "частичная запись");
exit(EXIT_FAILURE);
}
exit(EXIT_SUCCESS); }

СМОТРИТЕ ТАКЖЕ

getpagesize(2), mincore(2), mlock(2), mmap2(2), mprotect(2), mremap(2), msync(2), remap_file_pages(2), setrlimit(2), shmat(2), shm_open(3), shm_overview(7)
B.O. Gallmeister, POSIX.4, O'Reilly, стр. 128-129 и 389-391.

2012-04-16 Linux