Применение ассоциативных правил
Для реализации данного бакалаврского проекта был выбран метод Apripri.
Допустим, имеется транзакционная база данных D. Присвоим значениям товаров переменные (табл. 2.3) [10–17].
Таблица 2.3 – Транзакционная база данных TID
TID | Приобретенные покупки |
Пена для бритья, гель для душа, бальзам после бритья | |
Гель для душа, мыло | |
Гель для душа, пена для бритья, мыло, бальзам после бритья | |
Духи, мыло | |
Пена для бритья, гель для душа, бальзам после бритья, мыло | |
Крем для тела |
Пена для бритья = a; Гель для душа = b; Бальзам после бритья = c;
Мыло = d; Духи = e; Крем для тела = f;
Рассмотрим набор товаров (Itemset), включающий, например, {пена для бритья, гель для душа, бальзам после бритья}. Выразим этот набор с помощью переменных, получаем: abc={a,b,c}
В ассоциативных правилах существует понятие поддержки. Это набор товаров встречается в разработанной базе данных три раза, т.е. поддержка этого набора товаров равна 3: SUP(abc)=3. При минимальном уровне поддержки, равной трем, набор товаров abc является часто встречающимся шаблоном. В таблице 2.4 приведены часто встречающиеся товары.
При минимальном уровне поддержки, равной трем, набор товаров abc является часто встречающимся шаблоном. min_sup=3, {Пена для бритья, гель для душа, бальзам после бритья} − часто встречающийся шаблон [10–17].
Поддержкой называют количество или процент транзакций, содержащих определенный набор данных.
Для данного набора товаров поддержка, выраженная в процентном отношении, равна 50%. SUP(abc)=(3/6)*100%=50%
Поддержку иногда также называют обеспечением набора. Таким образом, набор представляет интерес, если его поддержка выше определенного пользователем минимального значения (min support). Эти наборы называют часто встречающимися (frequent).
В ассоциативных правилах также существует понятие достоверности. Правило «Из A следует B» справедливо с достоверностью С, если c% транзакций из всего множества, содержащих набор элементов A, также содержат набор элементов B.
Число транзакций, содержащих мыло, равно четырем, число транзакций, содержащих пену для бритья, равно трем, достоверность правила равна (3/4)*100%, т.е. 75%.
Достоверность правила «Из покупки мыла следует покупка пены для бритья» равна 75%, т.е. 75% транзакций, содержащих товар А, также содержат товар B.
Таблица 2.4 – Часто встречающиеся наборы товаров
TID | Приобретенные покупки | TID | Приобр. покупки | |
Пена для бритья, гель для душа, бальзам после бритья | a, b, c | |||
Гель для душа, мыло | b, d | |||
Гель для душа, пена для бритья, мыло, бальзам после бритья | b, a, d, c | |||
Духи, мыло | e, d | |||
Пена для бритья, гель для душа, бальзам после бритья, мыло | a, b, c, d | |||
Крем для тела | f |
Также существуют и другие методы адаптации услуг и продукции под конкретного пользователя. Таким методом является персонализация.