Анализ данных с помощью перекрестных запросов и сводных таблиц
Программа Access приспособлена и нацелена на сохранение всех подробностей в вашей БД. Но иногда вам не нужно знать все детали — взамен вы хотите получить общее представление. Необходим способ получения необработанных данных, которые могут включать сотни и тысячи записей и подведения итогов каким-либо осмысленным образом.
Вы уже познакомились с одним методом анализа больших объемов информации с помощью итогового запроса (см. разд. "Итоговые данные" главы 7). Применяя итоговый запрос, можно взять огромную подборку строк и сократить ее для нескольких искусно сгруппированных промежуточных итогов. В этой главе вы познакомитесь с двумя более специализированными вариантами обработки чисел: перекрестными запросами и сводными таблицами.
Перекрестные запросы и сводные таблицы играют ту же роль, что и уже знакомые вам итоговые запросы. Но они представляют данные несколько иначе. В перекрестных запросах применяются дополнительные столбцы для размещения информации в крайне сжатой таблице. Сводные таблицы используют интерфейс перемещений, позволяющий реорганизовать ваши итоги на лету для выявления различных тенденций и связей. Оба эти средства интенсивно используются в наборе средств любого специалиста Access.
Примечание
Для опробования перекрестных запросов и сводных таблиц вам нужны данные — большой объем данных. В БД, используемых в качестве примеров в предыдущих главах, нет достаточного количества исходных данных. В примерах этой главы используются некоторые таблицы огромной БД AdventureWorks — примера, предлагаемого корпорацией Microsoft и содержащего каталог товаров и сведения о продажах вымышленного производителя велосипедов. Найдите Web-страницу "Missing CD" для данной книги (на сайте www.missingmanuals.com)для загрузки нужной вам информации.
О перекрестных запросах
Перекрестный запрос — это мощное средство подведения итогов, исследующее большие объемы данных и применяющее их для вычисления промежуточных итогов и средних значений. Это определение может показаться знакомым, поскольку вы уже именно для этой цели использовали итоговые запросы в главе 7.
Как и итоговые запросы, перекрестные применяют два основных компонента: группировку и функции подведения итога. Группировка применяется для объединения строк в
небольшие подмножества. Функция подведения итога используется для вычисления единого значения для каждой группы.
За кадром перекрестные и итоговые запросы функционируют почти одинаково. Принимают большие количества записей и сокращают их до итогов, средних, минимальных или максимальных значений и т. д. Но есть два важных отличия.
Первое отличие заключается в том, в перекрестных запросах всегда применяется двухуровневая группировка. Например, в типичных итоговых запросах можно сгруппировать записи по товарам и увидеть самые ходовые из них или размер приносимого ими дохода. В перекрестном запросе можно проанализировать данные о продажах в зависимости от страны и категории товара. С помощью такого анализа вы сможете быстро определить, какие категории товаров особенно популярны в конкретных странах.
Рис. 9.1. Вверху: в итоговом запросе каждая группа занимает отдельную строку, отображая объемы продаж отдельной категории товаров в одной стране. В общем получается 24 группы, и в результате формируется длинный узкий список. Внизу: в перекрестном запросе программа Access применяет первый уровень группировки (в данном случае страну) для разделения данных на строки и следующий уровень (категорию товара) для распределения каждой строки по столбцам. Числа, которые вы видите, те же самые, что и на верхнем рисунке, но теперь у вас всего 6 строк с четырьмя категориями товаров в каждой
Другое отличие перекрестных запросов от итоговых заключается в способе представления программой Access результатов. Итоговый запрос создает отдельную строку для каждой группы. Например, если вы анализируете продажи в разных странах различных категорий товаров, итоговый запрос выведет строку для каждой комбинации страны и категории товаров, как показано в верхней части рис. 9.1. Перекрестный запрос действует несколько иначе; он использует ту же информацию, но располагает ее в отдельных столбцах, создавая более сжатое представление (нижняя часть рис. 9.1).
На рис. 9.1 внизу показано, как выглядят данные с двумя уровнями группировки: страны и товары. Но если хотите, в перекрестных запросах можно применять и больше уровней. (Большее число уровней группировки полезно для выполнения более детального анализа — например, для определения, какие товары особенно популярны в конкретных странах, штатах и городах.) В этом случае последний уровень группировки используется для разделения строки на столбцы. Все остальные уровни применяются для разбиения результатов на большее число строк. Если создать перекрестный запрос, группирующий объемы продаж по категориям товаров, названиям товаров и странам, вы увидите результат, показанный на рис. 9.2.
Рис. 9.2. В данном примере записи сгруппированы в строки по категориям товаров и затем разделены на отдельные товары. Затем данные по каждому товару дополнительно делятся на столбцы в зависимости от страны
Примечание
Помните о том, что при использовании нескольких уровней группировки последний уровень (используемый для формирования столбцов) не должен быть связан с другими уровнями. В то
время как другие уровни группировки могут быть связаны между собой. Пример на рис. 9.2 работает, потому что следует этому правилу (группировка по категории, товару и затем стране). Если эти же данные сгруппировать иначе (например, по категории, стране и товару), результат будет далеко не так хорош.
Часто задаваемый вопрос.