Оптимальные деревья поиска

Встречаются ситуации, в которых можно получить информацию о вероятности обращений к отдельным ключам. Обычно в таких случаях дерево поиска строится один раз, имеет неизменяемую структуру, в него не включаются новые ключи, и из него не исключаются существующие ключи. Примером соответствующего приложения является сканер компилятора, одной из задач которого является определение принадлежности очередного идентификатора к набору ключевых слов языка программирования. На основе сбора статистики при многочисленной компиляции программ можно получить достаточно точную информацию о частотах поиска по отдельным ключам.

Пусть дерево поиска содержит n вершин, и обозначим через p_i вероятность обращения к i-той вершине, содержащей ключ k_i. Сумма всех p_i, естественно, равна 1. Постараемся теперь организовать дерево поиска таким образом, чтобы обеспечить минимальность общего числа шагов поиска, подсчитанного для достаточно большого количества обращений. Будем считать, что корень дерева имеет высоту 1 (а не 0, как раньше), и определим взвешенную длину пути дерева как сумму p_i*h_i (1<=i<=n), где h_i - длина пути от корня до i-той вершины. Требуется построить дерево поиска с минимальной взвешенной длиной пути.

В качестве примера рассмотрим возможности построения дерева поиска для трех ключей 1, 2, 3 с вероятностями обращения к ним 1/7, 2/7 и 4/7 соответственно (рисунок 25).

Посчитаем взвешенную длину пути для каждого случая. В случае (a) взвешенная длина пути P(a) = 1*4/7 + 2*2/7 + 3*1/7 = 11/7. Аналогичные подсчеты дают результаты P(b)=12/7; P(c)=12/7; P(d)=15/7; P(e)=17/7. Следовательно, оптимальным в интересующем нас смысле оказалось не идеально сбалансированное дерево (c), а вырожденное дерево (a).

Оптимальные деревья поиска - student2.ru На практике приходится решать несколько более общую задачу, а именно, при построении дерева учитывать вероятности неудачного поиска, т.е. поиска ключа, не включенного в дерево.

Оптимальные деревья поиска - student2.ru

a) (b) (c) (d) (e)
Рисунок 25 -

При построении дерева оптимального поиска вместо значений p_i и q_j обычно используют полученные статистически значения числа обращений к соответствующим вершинам. Процедура построения дерева оптимального поиска достаточно сложна и опирается на тот факт, что любое поддерево дерева оптимального поиска также обладает свойством оптимальности. Поэтому известный алгоритм строит дерево "снизу-вверх", т.е. от листьев к корню. Сложность этого алгоритма и расходы по памяти составляют O(n²). Имеется эвристический алгоритм, дающий дерево, близкое к оптимальному, со сложностью O(n*log n) и расходами памяти - O(n).

Наши рекомендации

Задача поиска. Красно-черные деревья. Задача балансировки для красно-черных деревьев.

Задача поиска. Деревья бинарного поиска (ДБП). Операции над ними.

Задача поиска. Деревья, сбалансированные по высоте. Основные типы

Метод линейного поиска. Метод градиента (Уилсон-Бокс). Метод градиента с переменным шагом перемещения. Метод случайного поиска. Симплексный метод поиска оптимума объекта.

Алгоритм поиска экстремума функции по методу случайного поиска по двум параметрам.

Библиотеки НГПУ. Методика информационного поиска. Виды каталогов. Алфавитный каталог. Алгоритм поиска

Бинарные деревья. Построение дерева. Обход дерева. Поиск по дереву. Удаление элементов. Сбалансированные деревья. АВЛ-деревья. Красно-черные деревья. Оптимальные деревья поиска

Сильно ветвящиеся деревья. B-деревья. Включение-исключение элементов

Наблюдения за растительным миром. Деревья. Зимой деревья без листьев - можно хорошо рассмотреть их строение: крону, ствол, расположение веток

Поведение потребителей на стадии поиска. Модели поиска и обладания

← Предыдущая страница | Следующая страница →