Показатели, характеризующие вариации вокруг центральной тенденции

В §10 указывалось, что к показателям, характеризующим вариации вокруг центральной тенденции, относятся размах вариации, дисперсия, среднеквадратичное отклонение от среднего и коэффициент вариации.

О п р е д е л е н и е. Дисперсия выборки ("рассеивание")- это величина, характеризующая разброс ее значений вокруг среднего. Обозначается Д(Х).

Чем больше дисперсия, тем "случайнее" изучаемый процесс. Дисперсия определяет степень правдоподобия прогноза развития изучаемого процесса. Рассмотрим пример. Допустим, вариационный ряд имеет следующий вид: 42635445362264435. Нетрудно убедиться, что математическое ожидание для этой выборки равно 4. Это значит, как указывалось выше, что варианта 4 отражает центральную тенденцию ряда, т.е. является типичной для него и поэтому, если пытаться оценить значение восемнадцатой варианты, самое вероятное значение- это 4. При этом следует помнить, что 100%-ых прогнозов не существует, а можно говорить лишь о более или менее вероятных значениях. Теперь рассмотрим другой вариационный ряд: 43553444355533435. И здесь математическое ожидание выборки равно 4, а значит, для прогноза значения восемнадцатой варианты тоже стоит выбрать 4. Возникает сразу ряд вопросов: в каком из этих двух случаев прогноз более состоятелен, т.е. в каком случае вероятность ошибиться меньше, с чем это связано? Забегая вперед, ответим. Во втором случае процесс менее случаен, у него суммарная степень отклонения вариант от математического ожидания меньше или, как говорят, меньше разброс. А значит, вероятность того, что значение восемнадцатой варианты равно 4, во втором случае выше, чем для первой выборки. То есть, для первой выборки значение дисперсии выше, чем для второй.

Рассмотрим, как вычисляется дисперсия.

Для точечного распределения

Д(Х)= (х1 - М(Х))² р1 + (х2 - М(Х))² р2 +...+(хn -М(Х))² рn ,

где хi- значения вариант, рi-значения соответствующих относительных частот.

Для примера 4 вычислим дисперсию. Напомним, что М(Х)=9.7. По формуле:

Д(Х)= (2-9.7)² ·1/20+ (6-9.7)² ·5/20+ (10-9.7)² ·7/20+ (12-9.7)² ·3/20+ (14-9.7)²·4/20=10.91.

С дисперсией связана другая характеристика- с р е д н е к в а д р а т и ч н о е о т к л о н е н и е (или стандарт):

σ² = Д(Х).

Если для некоторой выборки мы имеем М(Х) и σ, то имеем ориентировочное представление о том, в каких пределах могут лежать наиболее вероятные значения интересующего нас признака: [M(X)- σ, M(X)+σ].

Для примера 4 σ ≈3.3 и, значит, соответствующий интервал для выборки из примера 4 будет [6.4; 13]. Нетрудно видеть, что при большом значении дисперсии интервал прогноза будет большим, а значит, такой прогноз для исследователя не очень интересен, и он лишний раз свидетельствует о том, что интересующий процесс «весьма случаен».

Вычислим дисперсию в случае интервального распределения изучаемого признака. Каждый интервал мы заменяем его средним значением, а далее пользуемся формулой, которая использовалась для точечного распределения:

Д(Х) =1/n Σ (zк –М(Х))² nк =1/n Σ (zо +kh-zо -kh)² nk =h² /n Σ (k-k)² nk =

= h ²(1/n Σ k² n -к² ),

где k=1/n Σ knk и суммирование по k.

Проиллюстрируем описанные вычислительные процедуры, рассмотрев случай интервального распределения выборочных данных. Обратимся опять к примеру 5. Для упрощения вычислений дополним таблицу:

Итервалы (классы) 20-25 25-30 30-35 35-40 40-45 45-50  
ni S = 40
ki -4 -3 -2 -1  
niki -8 -9 -12 -10 S=-37
niki² S=95

Для данного примера

Д(Х)= 5²· (1/ 40·95- (37/40)²)≈37.98; σ ≈6.16.

Следующая характеристика, также свидетельствующая об уровне вариации вокруг центральной тенденции- размах вариации.

О п р е д е л е н и е. Размах вариации- это числовая характеристика, равная по величине разности между максимальным и минимальным значениями вариант:

V(Х)= хmax-хmin.

От величины размаха вариации зависит величина дисперсии. Чем больше размах вариации, тем больше будет значение дисперсии.

О п р е д е л е н и е . Коэффициент вариации- это числовая характеристика выборки, которая показывает соотношение между математическим ожиданием выборки и ее дисперсией:

R(Х)=М(Х)/Д(Х)·100%

ВЫВОДЫ ПО ЭКСПЕРИМЕНТУ

Одна из труднейших задач проведения эксперимента - подведение его итогов. Выводы по эксперименту, прежде всего, должны быть ориентированы на выдвинутую с самого начала гипотезу. Они должны подтверждать гипотезу или противоречить ей. В первом случае следует очень кратко воспроизвести основные данные, свидетельствующие в ее пользу, во втором случае - дать объяснение, попытаться выявить причину основных расхождений, и в случае принятия объективных данных, опровергающих гипотезу, изменить ее в соответствии с ними. Второе, что очень важно учесть при поведении итогов, - требование о том, чтобы выводы были соизмеримыми с экспериментальной базой и собранными данными, т.е., чтобы выводы не были «глобальными», выходящими за пределы поставленных задач и области конкретных исследований

Хотя исследователя важно предупредить о необходимости избегать развернутых выводов, тем не менее, нельзя не отметить, что при подлинно научной экспериментальной проверке какой-либо исследовательской проблемы с учетом связи ее с рядом других факторов, в эксперимент оказываются втянутыми и эти факторы, и ряд дополнительных связей. Поэтому данные и выводы по эксперименту в известной степени могут и должны затрагивать и их. Исследователь поэтому может высказать некоторые предположения о связи данной области с пограничными зонами, но все же больше он должен говорить о необходимости продолжения дальнейших исследований в этих областях с изучением дополнительных влияний или влияния тех факторов, которые были учтены еще в недостаточной мере. Делая выводы, исследователь должен еще раз оговорить условия эксперимента, которые могли повлиять на степень надежности тех данных, по которым делаются выводы, и подчеркнуть, что эксперимент не универсальный и не единственный метод, которым следует пользоваться для разработки данного аспекта, и дать оценку его роли и места в системе других методов, использовавшихся им при ведении исследований по проблеме. Если результаты эксперимента ( и данные, полученные с помощью других методов ведения исследования) свидетельствуют о том, что следует ставить вопрос о необходимости внедрения тех или иных проверявшихся средств, методов и приемов обучения, исследователь, завершая свое исследование, может наметить некоторые пути осуществления этого внедрения.

Таким образом, заключительный этап обработки данных эксперимента включает:

1. Соотнесение выводов с общей и частной гипотезой.

2. Четкое ограничение области, на которую могут быть распространены полученные выводы.

3. Высказывание предположений о возможности их распространения на некоторые пограничные области и указание основных направлений дальнейших исследований в этой и смежной областях.

4. Оценку степени важности выводов в зависимости от чистоты условий эксперимента.

5. Оценку роли и места эксперимента в системе других применявшихся в данном исследовании методов.

6. Практические предположения о внедрении в практику результатов проведенного исследования.

ЛИТЕРАТУРА

1.Белова А. Математическая статистика, Москва,1976

2.Вентцель Е.С. Теория вероятностей, Москва,1977

3.Гмурман В.Е. Теория вероятностей и математическая статистика, Москва, Изд-во "Высшая школа",1977

4.Факультативный курс по основам теории вероятностей и математической статистике, Москва,1986

5.Завадский Ю.В. Основные сведения по математической статистике. - Курс лекций,Москва,1971

6.Лихолетов И.И. Руководство к решению задач по высшей математике, теории вероятностей и математической статистике, Минск,1976.

Наши рекомендации