Генеральная совокупность и выборка. Репрезентативность выборки
Генеральная совокупность
Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени.
Примеры генеральных совокупностей:
- Все жители Москвы (10,6 млн. человек по данным переписи 2002 года)
- Мужчины-Москвичи (4,9 млн. человек по данным переписи 2002 года)
- Юридические лица России (2,2 млн. на начало 2005 года)
- Розничные торговые точки, осуществляющие продажу продуктов питания (20 тысяч на начало 2008 года) и т.д.
Выборка (Выборочная совокупность)
Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.
Репрезентативность выборки
Свойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.
Пример:
- Выборка, целиком состоящая из москвичей, владеющих автомобилем, не репрезентирует все население Москвы.
- Выборка из российских предприятий численностью до 100 человек не репрезентирует все предприятия России.
- Выборка из москвичей, совершающих покупки на рынке, не репрезентирует покупательское поведение всех москвичей.
В то же время, указанные выборки (при соблюдении прочих условий) могут отлично репрезентировать москвичей-автовладельцев, небольшие и средние российские предприятия и покупателей, совершающих покупки на рынках соответственно.
Важно понимать, что репрезентативность выборки и ошибка выборки – разные явления. Репрезентативность, в отличие от ошибки никак не зависит от размера выборки.
Пример:
Как бы мы не увеличивали количество опрошенных москвичей-автовладельцев, мы не сможем репрезентировать этой выборкой всех москвичей.
9. Виды квантильной стандартизации.
Квантильная стандартизация. В некоторых случаях знания степени отклонения индивидуального результата от среднегруппового бывает недостаточно. Экспериментатору необходимо оценить место, которое занимает испытуемый в популяции по исследуемому показателю, т. е. узнать, какой процент испытуемых выполняет тест хуже или лучше обследованного лица, имеет более высокие или более низкие оценки и т.п. Ответ на эти вопросы может быть получен на основе распределения накопленных частот. Исходные оценки выражают результаты тестирования через задания теста, а преобразованные – через популяцию. Обе эти шкалы связаны нелинейным образом.
На практике используются не точные, а интервальные оценки места испытуемого в популяции. С этой целью ось накопленной частоты разбивается на фиксированное число равных интервалов. Точка на оси накопленной частоты, делящая ось в установленной пропорции, называется квантилем, поэтому этот вид стандартизации называется квантильной стандартизацией.
Квантиль – это общее понятие, а квартили, квинтили, децили и процентили – его наиболее частные реализации. Имеются, например, три квартиля (Q1, Q2, Q3), которые делят выборку на четыре равные части (кварты) таким образом, что 25% испытуемых располагаются ниже Q1, 50% – ниже Q2 и 75% – ниже Q3. Четыре квинтиля (К1, К2, КЗ, К4) делят выборку аналогичным образом на пять равных частей, девять децилей (D1, ..., D9) –на десять равных частей, а 99 процентилей (Р1, ..., Р99) - на 100 равных частей.
Номер квантиля используется в качестве новой преобразованной тестовой оценки. Он показывает относительное положение испытуемого в нормативной выборке. Например, квартильная оценка 3 и процентильная оценка 75 указывают, что более высокую тестовую оценку могут иметь только 25% испытуемых.
антильная шкала является равноинтервальной только относительно накопленной частоты. В этом смысле квантильная стандартизация является методом стандартизации, как бы противоположным методу, предложенному Р.Б. Кэттеллом. В методе стандартизации Р.Б. Кэттелла равноинтервальная шкала строится на оси абсцисс, а в методе квантильной стандартизации – на оси ординат, т.е. метод Р.Б. Кэттелла группирует тестовые оценки, а квантильный метод группирует испытуемых.
Таким образом, в процессе подготовки тестов к практическому использованию тестовые результаты претерпевают три вида преобразований: приведение к нормальному виду, приведение к стандартной форме и квантильная группировка. Эти три вида преобразований следует рассматривать не как самостоятельные и независимые процедуры, а как последовательность шагов представления результатов тестирования в виде, удобном для осмысления и интерпретации.
10. Понятие стандартизации и нормирование «сырых оценок/баллов» в психологии.
Добиться объективности диагностической методики можно при выполнении следующих условий:
• единообразие процедуры проведения теста для получения сравнимых с нормой результатов;
• единообразие оценки выполнения теста;
• определение нормы выполнения теста для сопоставления с ними показателей, полученных в результате обработки данных тестирования.
Эти три условия называют этапами стандартизации психологического теста.
Первый этап стандартизации психологического теста, как было озвучено выше, состоит в создании единообразной процедуры тестирования. Она включает определение следующих моментов диагностической ситуации:
• условия тестирования (помещение, освещение и др. внешние факторы). Очевидно, что объем кратковременной памяти лучше измерять (например, с помощью субтеста повторения цифровых рядов в тесте Векслера), когда нет внешних раздражителей, таких как посторонние звуки, голоса и т.д.;
• инструкции следует сообщать испытуемым одинаковым образом, как правило, письменно; в случае устных указаний они даются в разных группах одними и теми же словами, понятными для всех, в одинаковой манере;
• содержание инструкции и особенности ее предъявления (тон голоса, паузы, скорость речи и т.д.). Например, в тесте "10 слов" каждое слово должно предъявляться через определенный интервал времени в секундах;
наличие стандартного стимульного материала.
• достоверность полученных результатов существенно зависит от того, предлагаются ли респонденту изготовленные самодельные карты Г. Роршаха или стандартные – с определенной цветовой гаммой и цветовыми оттенками;
• ни одному испытуемому не следует давать никаких преимуществ перед другими;
• в процессе эксперимента не следует давать отдельным испытуемым дополнительные пояснения;
• временные ограничения выполнения данного теста. Например, для выполнения теста Равена взрослому респонденту дается 20 минут;
• стандартный бланк для выполнения данного теста. Использование стандартного бланка облегчает процедуру обработки;
• учет влияния ситуационных переменных на процесс и результат тестирования. Под переменными подразумевается состояние испытуемого (усталость, перенапряжение и т.д.), нестандартные условия тестирования (плохое освещение, отсутствие вентиляции и др.), прерывание тестирования;
• учет влияния поведения диагноста на процесс и результат тестирования. Например, одобрительно-поощряющее поведение экспериментатора во время тестирования может восприниматься респондентом как подсказка "правильного ответа" и др.;
• учет влияния опыта респондента в тестировании. Естественно, что респондент, который уже не в первый раз проходит процедуру тестирования, преодолел чувство неизвестности и выработал определенное отношение к тестовой ситуации. Например, если респондент уже выполнял тест Равена, то, скорее всего, не стоит предлагать ему его во второй раз;
• эксперимент с разными группами следует проводить в одинаковое, по возможности, время дня, в сходных условиях.
Обычно авторы методики в руководстве приводят точные и подробные указания по процедуре ее проведения. Формулирование таких указаний составляет основную часть стандартизации новой методики, так как только строгое их соблюдение дает возможность сравнить между собой показатели, полученные разными испытуемыми.
Создание единообразной оценки выполнения теста
Второй этап стандартизации психологического теста состоит в создании единообразной оценки выполнения теста: стандартной интерпретации полученных результатов и предварительной стандартной обработки. Этот этап предполагает также сравнение полученных показателей с нормой выполнения этого теста для данного возраста (например, в тестах интеллекта), пола и т.д. стандартизация тест психодиагностический
Важным этапом в стандартизации методики является выбор критерия, по которому следует проводить сравнение результатов диагностических испытаний, поскольку диагностические методики не имеют заранее определенных стандартов успешности или неудачи в их выполнении.
Так, например, ребенок шести лет, выполняя тест умственного развития, получил балл, равный 117. Хорошо это или плохо? Часто ли такой показатель встречается у детей данного возраста? Количественный результат как таковой ничего не означает. Полученный дошкольником балл нельзя интерпретировать как показатель относительно высокого, среднего или низкого развития, так как это развитие выражено в мерах, присущих данной методике, и, таким образом, абсолютного значения полученные результаты иметь не могут. Очевидно, нужно располагать точкой отсчета и какими-то дозированными мерами, чтобы с их помощью оценивать полученные при диагностировании индивидуальные и групповые данные. Возникает вопрос, что за эту точку отсчета брать? В традиционном тестировании такая точка добывается статистическим путем – это так называемая статистическая норма.
В общих чертах стандартизация диагностической методики, ориентированной на норму, осуществляется путем ее проведения на большой представительной выборке испытуемых, которая ничем не отличается от той, для которой данная методика предназначена. На этой группе испытуемых, называемой выборкой стандартизации, разрабатываются нормы, указывающие не только средний уровень выполнения, но и его относительную вариативность выше и ниже среднего уровня. В результате можно оценить разные степени успешности или неуспешности в выполнении диагностической пробы. Это позволяет определить положение конкретного испытуемого относительно выборки стандартизации.
Для вычисления статистической нормы психологи-диагносты обратились к давно применяемым в биологии приемам математической статистики.
Рассмотрим пример.
На призывной пункт явилось несколько тысяч молодых людей.
Допустим, что все они примерно одного возраста. Что мы получим при измерении их роста? Обычно оказывается, что большинство почти одного роста, совсем немного будет людей очень маленького и очень высокого роста. Остальные же распределятся симметрично, уменьшаясь по количеству от среднего максимума в ту и другую сторону. Распределение рассматриваемых величин – это нормальное распределение (или распределение по нормальному закону, кривая распределения Гаусса). Математики показали, что для описания такого распределения достаточно знать два показателя – среднюю арифметическую и так называемое стандартное отклонение, которое получается путем несложных вычислений. Назовем среднюю арифметическую х, а стандартное отклонение у. При нормальном распределении все изучаемые величины практически находятся в пределах х + 5 у.
Рассмотрим, как определялась статистическая норма для тестов Стэнфорд-Бине. В группу испытуемых входили 4498 человек от 2,5 до 18 лет. Усилия стэнфордских психологов были направлены на то, чтобы распределение полученных по каждому возрасту данных о выполнении тестов было близко к нормальному. Этого результата удалось добиться далеко не сразу; в некоторых случаях ученым приходилось заменять одни задания другими. В конце концов, эта работа была закончена, и были подготовлены тесты по каждому возрасту со средней арифметической, равной 100, и со стандартным отклонением, равным 16. Принимается, что результаты в пределах х ± у показывают границы наиболее характерной, представительной части распределения, границы нормы для данного возраста. При у = 16 и х = 100 эти границы нормы будут от 84 до 116. Интерпретируется это так: результаты испытуемых, которые не выходят за эти границы, находятся в пределах нормы. Те, чьи результаты менее 84, находятся ниже нормы, а те, чьи результаты более 116, – выше нормы. Нередко этот же прием применяют и для дальнейшей классификации. Тогда результаты в пределах от х – у до х – 2 у интерпретируются как "несколько ниже нормы", а от х – 2 у до х – З у – как "значительно ниже нормы". Соответственно классифицируются результаты, находящиеся выше нормы.
Вернемся к результату, полученному ребенком шести лет, о котором упоминалось выше. Его успешность по тесту равна 117. Этот результат выше нормы, но очень незначительно (верхняя граница нормы 116).
Кроме статистической нормы, основой для сравнения, интерпретации результатов диагностических испытаний могут стать и такие показатели, как процентили.
Процентиль – это процентная доля индивидов из выборки стандартизации, первичный результат которых ниже данного первичного показателя.
Например, если 28 % людей правильно решат не более 15 задач в арифметическом тесте, то первичному показателю 15 соответствует 28-й процентиль (Р 28). Процентили указывают на относительное положение индивида в выборке стандартизации. Их также можно рассматривать, как ранговые градации, общее число которых равно 100, с той лишь разницей, что при ранжировании принято начинать отсчет сверху, т. е. с лучшего члена группы, получающего ранг 1. В случае же процентилей отсчет ведется снизу, поэтому чем ниже процентиль, тем хуже позиция индивида.
50-й процентиль (Р 50) соответствует медиане – одному из показателей центральной тенденции. Процентили свыше 50 представляют показатели выше среднего, а те, которые лежат ниже 50, – сравнительно низкие показатели. 25-й и 75-й процентили известны также под названием 1-го и 3-го квартилей, поскольку они выделяют нижнюю и верхнюю четверти распределения. Как и медиана, они удобны для описания распределения показателей и сравнения с другими распределениями.
Процентили не следует смешивать с обычными процентными показателями. Последние являются первичными показателями и представляют собой процент правильно выполненных заданий, тогда как процентиль – это производный показатель, указывающий на долю от общего числа членов группы. Первичный результат, который ниже любого показателя, полученного в выборке стандартизации, имеет нулевой процентильный ранг (Ро). Результат, превышающий любой показатель в выборке стандартизации, получает процентильный ранг 100 (Р 100). Эти процентили, однако, не означают нулевого или абсолютного результата выполнения теста.
Процентильные показатели обладают рядом достоинств, в частности:
-их легко рассчитать и понять даже сравнительно неподготовленному человеку;
-их применение достаточно универсально и подходит к любому типу тестов.
Однако недостаток процентилей – это существенное неравенство единиц отсчета в том случае, когда анализируются крайние точки распределения. При использовании процентилей (как уже отмечалось выше) определяется только относительное положение индивидуальной оценки, но не величина различий между отдельными показателями.