Критерии для проверки статистических гипотез. Параметрические и непараметрические критерии, условия их применения.
Статистическим критерием называют определённое правило, задающее условия, при которых проверяемую нулевую гипотезу следует либо отклонить, либо принять.
Критерии подразделяются на три типа:
1. Критерии значимости, которые служат для проверки гипотез о параметрах распределений генеральной совокупности (чаще всего нормального распределения). Эти критерии называются параметрическими (критерии Стьюдента, Фишера и др.).
2. Критерии, которые для проверки гипотез не используют предположений о распределении генеральной совокупности. Эти критерии не требуют знания параметров распределений, поэтому называются непараметрическими (критерии Уилкоксона, Ван дер Вардена, Манна-Уитни).
3. Критерии, служащие для проверки гипотез о согласии распределении генеральной совокупности, из которой получена выборка, с ранее принятой теоретической моделью (чаще всего нормальным распределением), называются критериями согласия (критерий Шапиро и Уилка, хи-квадрат критерий).
Параметрические критерии требуют выполнения определённых условий их применения. Например, критерий Стьюдента, используемый для оценки достоверности различий между средними арифметическими значениями совокупностей на основе малых выборок, может применяться только в случае нормального распределения сравниваемых совокупностей, поскольку был разработан специально для такого распределения. Кроме того, он может применяться тогда, когда дисперсии совокупностей отличаются незначительно. При невыполнении хотя бы одного из перечисленных условий для сравнения центральных тенденций совокупностей могут использоваться только непараметрические критерии.
Непараметрические критерии не предъявляют никаких требований к совокупностям, для сравнения которых они используются. Они являются менее точными, по сравнению с параметрическими, только в том случае, если совокупности распределены по нормальному закону. Во всех остальных случаях непараметрические критерии позволяют получить более точную оценку.
Наиболее простыми в вычислении являются критерии Манна-Уитни и Уилкоксона. По сути это один и тот же критерий, только первая его разновидность применяется для оценки достоверности различий между средними величинами независимых выборок, т.е. полученных на разных группах испытуемых, а вторая – для попарно зависимых выборок, т.е. полученных на одной и той же группе испытуемых.
23. Обработка данных в MSEXCEL. Основные операции с данными (сортировка, поиск, фильтрация данных, подведение итогов)
В электронных таблицах доступны такие средства обработки данных, как сортировка, фильтрация и формирование итогов. Использование этих средств требует представления электронной таблицы в виде базы данных или списка. В этом разделе показано, как представить электронную таблицу в виде базы данных и применить к ней аппарат сортировки, фильтрации и формирования итоговых данных, включая средства сводных таблиц.
Список — это один из способов организации данных на рабочем листе. Список создается как помеченный ряд, состоящий из строк с однотипными данными. Данные, организованные в список, в терминологии Excel называются базой данных (БД). При этом строки таблицы — это записи базы данных, а столбцы — поля записей БД. Чтобы превратить таблицу Excel в список или базу данных, необходимо присвоить столбцам однострочные имена, которые будут использоваться как имена полей записей БД. Следует иметь в виду, что однострочные имена столбцов могут состоять из нескольких строк заголовков, размещенных в одной строке таблицы Excel.
При создании списка или базы данных на рабочем листе Excel необходимо выполнять следующие правила:
1. На одном рабочем листе не следует помещать более одного списка, поскольку некоторые операции, например Фильтрация,работают в определенный момент только с одним списком.
2. Следует отделять список от других данных рабочего листа хотя бы одним незаполненным столбцом или одной незаполненной строкой. Это поможет Excel автоматически выделить список при выполнении фильтрации или при сортировке данных.
3. Список может занимать весь рабочий лист.
4. Имена столбцов должны располагаться в первой строке списка. Excel использует эти имена при создании отчетов, в поиске и сортировке данных.
5. Для имен столбцов следует использовать шрифт, тип данных, выравнивание, формат, рамку или стиль прописных букв, •отличных от тех, которые использовались для данных списка.
6. Чтобы отделить имена столбцов от данных, следует разместить рамку по нижнему краю ячеек строки с именами столбцов. Не рекомендуется использовать пустые строки или пунктирные линии.
Сортировка данных. Список БД можно отсортировать по алфавиту, числам или в хронологическом порядке в соответствии с содержанием определенного столбца или столбцов.
Чтобы отсортировать весь список, достаточно выделить одну ячейку и выбрать в меню Данныекоманду Сортировка.Excel автоматически выделит весь список. Если в первой строке списка БД находятся имена столбцов, то они не будут включены в сортировку. Необходимо иметь в виду, что в этом случае итоговая строка исходного списка также будет включена в сортировку, поэтому целесообразнее самостоятельно выделять область исходного списка для сортировки.
Команда Сортировкаосуществляется через диалоговое окно. В трех окнах ввода окна Сортировкаможно задать ключи, по которым она будет выполнена.
В диалоговом окне Сортировкаимеется режим Параметры,который позволяет установить порядок сортировки по первому ключу — обычный или определяемый пользователем, задать учет кодировки строчных и прописных букв (учет регистра символов), а также направление сортировки — по возрастанию или по убыванию.
Для быстрой сортировки на панели инструментов Стандартнаянаходятся две кнопки:
Фильтрация данных в списке. С помощью фильтров можно выводить и просматривать только те данные, которые удовлетворяют определенным условиям.
Excel позволяет быстро и удобно просматривать требуемые данные из списка БД с помощью простого средства — автофильтра. Более сложные запросы к базе данных можно реализовать с помощью команды Расширенный фильтр.
Чтобы использовать автофильтр,надо сначала выделить область БД для поиска, с заголовками столбцов. При этом имена столбцов списка Excel преобразует в имена полей записей БД.
Затем выполнить команду Автофильтрв меню Данные.
По команде АвтофильтрExcel помещает раскрывающиеся стрелки непосредственно на имена столбцов списка. Щелкнув по стрелке, можно вывести на экран список всех уникальных элементов соответствующего столбца. Если выделить некоторый элемент столбца, то будут скрыты все строки, кроме тех, которые содержат выделенное значение.
Элемент столбца, который выделен в раскрывающемся окне списка, называется критерием фильтра. Можно продолжить фильтрацию списка с помощью критерия из другого столбца. Чтобы удалить критерии фильтра для отдельного столбца, надо выбрать параметр Всев раскрывающемся списке столбца. Чтобы показать все скрытые в списке строки, надо выбрать в меню Данныекоманду Фильтр,а затем — команду Показать все.
С помощью автофильтра можно для каждого столбца задать Пользовательские критерииотбора записей базы данных, например, вывести на экран только те записи, значения полей которых находятся в пределах заданного интервала. Чтобы задать пользовательский критерий, надо в раскрывающемся списке столбца выбрать параметр Настройка...затем в диалоговом окнеПользовательскийавтофильтрввести нужные критерии.
Возможна фильтрация списков в Excel по сложным критериям с использованием команды Расширенный фильтр.
Для фильтрации списка или базы данных по сложному критерию, который будет определен ниже, а также для получения части исходного списка по нескольким заданным столбцам в Excelис пользуется команда Расширенный фильтрменю Данные.Отличие этой команды от команды Автофильтрсостоит в том, что кроме перечисленных выше возможностей отфильтрованные записи можно вынести в другое место рабочего листа Excel, не испортив исходный список.
Чтобы использовать команду Расширенный фильтр,надо сначала создать таблицу критериев, которую следует разместить на;том же рабочем листе, что и исходный список, но так, чтобы не скрывать его во время фильтрации.
Для формирования таблицы критериев необходимо скопировать имена полей записей БД (имена столбцов списка) в ту часть рабочего листа, где будет располагаться таблица критериев.
При этом число строк в этой таблице определяется только числом критериев поиска. Однако включение пустых строк в таблицу критериев недопустимо, поскольку в этом случае будут найдены все записи базы данных. Задание критериев поиска в виде констант требует точной копии имен тех столбцов исходного списка, которые задают условия фильтрации. Кроме таблицы критериев для команды Расширенный фильтрнадо определить вид выходного документа. Это означает, что следует скопировать в свободное место рабочего листа имена только тех столбцов списка, ко-1 торые определяют вид выходного документа. Количество строк в выходном документе Excel определит сам.
Таким образом, для выполнения команды Расширенный фильтрнадо выполнить три действия:
сформировать в свободном месте рабочего листа таблицу критериев;
сформировать шапку выходного документа;
выделить область поиска в исходном списке.
Использование вычислительного критерия. Ввод вычисляемых критериев поиска в таблицу требует выполнения следующих правил.
1. Формула должна выводить логическое значение истина или
ложь. После выполнения поиска на экран выводятся только те стро
ки, для которых результатом вычисления формулы будет истина.
2. Формула должна ссылаться хотя бы на один столбец в списке.
Использование вычисляемого критерия накладывает существенное ограничение на таблицу критериев. В этом случае имя столбца в таблице критериев, содержащего значение вычисляемого критерия, должно отличаться от имени подобного столбца в исходном списке.
Формирование итогов в электронной таблице осуществляется командой Итогииз меню Данные.Чтобы команда Итогиработала, список должен быть сначала отсортирован. После сортировки можно подсчитать итоги по группам записей. Команда Итогипозволяет подводить итоги более чем по одному полю из группы записей, а также добавлять обрабатываемые поля и применять для вычисления итогов другие функции.
Сводная таблица — это еще один инструмент обработки больших списков с данными. Поскольку в этом случае сразу подводятся итоги, выполняются сортировка и фильтрация списков, то сводная таблица является более мощным инструментом обработки данных, который называется «Мастер сводных таблиц». Для создания сводной таблицы необходимо выполнить следующие шаги:
выделить область списка;
в меню Данныевыбрать команду Сводная таблица,по которой на экран выводится окно Мастера сводных таблиц;
щелкнув по кнопке Далее,перейти к следующему шагу.
С помощью мыши можно перетащить поля списка из правой части окна Мастера сводных таблицв области Строки, Столбцаи Данныхв том же окне. Таким образом формируется вид выходного документа.
Последний шаг построения сводной таблицы определяет, где будет размещена сводная таблица. Рекомендуется размещать ее на отдельном рабочем листе. При необходимости можно сводную таблицу озаглавить.
Для печати электронной таблицы ее следует предварительно подготовить. Для этого необходимо:
разбить ЭТ на страницы;
установить параметры страницы;
создать необходимые колонтитулы;
создать заголовки для печати, чтобы шапка таблицы выводи
лась на каждом листе;
просмотреть материал, подготовленный для печати.
Чтобы разбить ЭТ на страницы, необходимо вставить горизонтальные разделители конца страницы в требуемых местах ЭТ. Для этого надо выполнить следующее: выделить строку, с которой надо начать новую страницу; в меню Вставкавыполнить команду Разрыв страницы;
В результате Excel вставит широкую пунктирную линию (конец страницы) сверху от выделенной строки.
Аналогично можно разбить на страницы остальную часть ЭТ.
Для установки параметров страницы в меню Файлследует выбрать команду Параметры страницы,определив размеры полей, наличие и расположение колонтитулов, а также наличие заголовков таблицы и другие параметры.
27. Глобальная компьютерная сеть Internet. Общая характеристика и история развития сети. Подключение к сети интернет.