Scroll to navigation

HASH(3) Руководство программиста Linux HASH(3)

ИМЯ

hash - метод доступа к базе данных ассоциативных массивов

ОБЗОР

#include <sys/types.h>
#include <db.h>

ОПИСАНИЕ

Примечание: В этой странице описаны интерфейсы, предоставляемые glibc до версии 2.1. Начиная с версии 2.2, glibc больше не поддерживает эти интерфейсы. Вероятно, вы ищите API, предоставляемое библиотекой libdb.

Функция dbopen(3) — это библиотечный интерфейс к файлам баз данных. Один из поддерживаемых форматов файлов — hash. Общее описание методов доступа к базам данных находится в dbopen(3). Эта справочная страница содержит только информацию, относящуюся к ассоциативным массивам.

Структура данных ассоциативных массивов (хэш) расширяемая и динамична.

Структура данных, с помощью которой ассоциативному массиву обращается dbopen(3), задана в <db.h> следующим образом:

typedef struct {

unsigned int bsize;
unsigned int ffactor;
unsigned int nelem;
unsigned int cachesize;
uint32_t (*hash)(const void *, size_t);
int lorder; } HASHINFO;

Элементы этой структуры имеют следующее назначение:

определяет размер корзины хэш-таблицы, по умолчанию равный 256 байтам. Этот параметр может быть изменён, чтобы увеличить размер для таблиц, расположенных на диске, или таблиц с элементами большого размера.
указывает на желаемую плотность хэш-таблицы. Плотность — это максимальное количество ключей, которые могут находиться в одной корзине, определяющей, на какую величину увеличивается или уменьшается таблица. Значение по умолчанию — 8.
предполагаемый окончательный размер хэш-таблицы. Если значение не указано, или установлено слишком маленьким, то размер хэш-таблиц увеличивается каждый раз, когда добавляется новый ключ. Это может привести к снижению производительности. Значение по умолчанию — 1.
предполагаемый максимальный размер кэша памяти в байтах. Эта величина только рекомендация, метод доступа скорее выделит больше памяти, чем завершится с ошибкой.
пользовательская функция хэширования. Так как не существует функции, которая подходит для любых данных, пользователю может показаться, что встроенная хэш-функция слишком проста для некоторых типов данных. Определяемая пользователем функция должна иметь два аргумента (указатель на строку байтов и длина) и возвращать 32-битную величину, используемую как хэш-значение.
порядок байт для целых чисел, хранящихся в метаданных базы данных. Число должно представлять порядок байт в целом числе, например, при примом порядке (big endian) число представляется как 4321. Если lorder равно 0 (т. е. порядок не определён), то используется порядок байт машины. Если файл уже существует, то указываемое значение игнорируется и будет использоваться порядок байт, определённый при создании.

Если файл уже существует (и не задан флаг O_TRUNC), то значения, определённые в параметрах bsize, ffactor, lorder и nelem, игнорируются, и используются значения, которые были указаны при создании дерева.

Если определена хэш-функция, то hash_open попытается определить, совпадает ли эта функция с той, что использовалась при создании файла, и завершается с ошибкой, если это не так.

Обратно совместимый интерфейс, определённый в dbm(3) и ndbm(3), также существует, но он не совместим с предыдущими реализациями по формату файлов.

ОШИБКИ

Функции доступа к hash могут завершиться с ошибкой и присвоить errno любое значение из определённых для библиотеки функций dbopen(3).

ДЕФЕКТЫ

Поддерживаются значения только с прямым и обратным порядком байт.

СМОТРИТЕ ТАКЖЕ

btree(3), dbopen(3), mpool(3), recno(3)

Dynamic Hash Tables, Per-Ake Larson, Communications of the ACM, April 1988.

A New Hash Package for UNIX, Margo Seltzer, USENIX Proceedings, Winter 1991.

2012-04-23 4.4 Berkeley Distribution