Тема 1. предмет и метод статистики

ТЕМА 1. ПРЕДМЕТ И МЕТОД СТАТИСТИКИ

1. Предмет статистики

2. Понятия и особенности статистической методологии

3. Основные этапы статистического исследования

4. Понятия и категории статистической науки

5. Организация государственной статистики в РФ

6. Задачи статистики

Предмет статистики

Статистика изучает массовые общественные явления и складывающиеся в них количественные закономерности.

Статистика - 1. отрасль знаний, специальная научная дисциплина

2.отрасль практической деятельности, направленная на сбор, обработку, анализ и публикацию массовых данных о явлениях и процессах общественной жизни

3.совокупность цифровых сведений, характеризующих какое-либо явление общественной жизни или совокупность явлений

4.термины, приемы в математической статистике для описания функций, результатов наблюдений

Понятия и особенности статистической методологии

Статистическая наука разрабатывает приемы количественного анализа массовых общественных явлений, которые в совокупности составляют статистическую методологию.

Особенности статистической методологии:

ý точное измерение и описание массовых данных

ý измерение и анализ дифференциации явлений

ý применение связных, обобщающих показателей для характеристики явлений и закономерностей их развития

Большое значение для статистической методологии имеет Закон больших чисел: в массе индивидуальных явлений общая закономерность тем полнее и точнее, чем больше их охвачено наблюдением. Следовательно, статистическая закономерность есть объективная количественная закономерность массового процесса.

Основные этапы статистического исследования

1. Статистическое наблюдение - процесс сбора информации о явлениях и процессах, подлежащих изучению

2. Сводка статистической информации - собранная информация подлежит систематизации, обобщению, группировке

3. Анализ данных - обобщение и анализ статистических фактов и поиск объектов количественной закономерности

Понятия и категории статистической науки

Основные понятия и категории статистической науки составляют ее специфический язык.

Признак - характерная черта, свойство единиц объектов, явлений, которые могут быть наблюдаемы и измерены.

Признаки могут быть качественными и количественными. Количественными признаками называются такие, отдельные значения которых отличны друг от друга по величине, выражаются числом. Качественные (атрибутивные) признаки выражаются в виде определений, отражающих их сущность, качество, состояние.

Колеблемость значения признака у отдельных единиц совокупности называется вариацией признака, а отдельные значения признака - вариантами.

Показатель - количественное выражение признака.

Частота - количество единиц того или иного признака в ряду распределения.

Статистическая совокупность - множество объектов или явлений, изучаемых статистикой, которые имеют один или несколько общих признаков.

Отдельные отчеты или явления, образующие статистическую совокупность, называются единицами наблюдения.

Совокупность называется однородной, если самые существенные признаки для каждой ее единицы близки по значению, то есть их вариация незначительна, разнородной - если объединяет разные типы явлений

Задачи статистики

Задачи:

Þ познание количественной стороны общественных явлений в конкретных условиях места и времени

Þ создание фундаментальных фактов для открытия законов и закономерностей

Þ подтверждение, конкретизация и иллюстрация открытых ранее законов и закономерностей.

ТЕМА 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ

1. Понятие статистического наблюдения и его основные формы

2. Виды статистического наблюдения

3. Способы сбора статистической информации

4. Программно-методологические и организационные вопросы наблюдения

5. Ошибки наблюдения

Ошибки наблюдения

Принципиальное значение имеют вопросы точности наблюдения.

Ошибки наблюдения бывают двух видов:

Œ случайные

 систематические

Случайные ошибки менее опасны, так как они взаимно погашаются.

Систематические ошибки наиболее опасны, так как устойчиво искажают информацию.

К случайным ошибкам относятся ошибки выборочного наблюдения, ошибки репрезентативности, которые возникают в силу несплошного характера наблюдения.

Метод группировок

Группировка - эффективный метод исследования массовых общественных явлений.

Ее цель - выявить характерные черты и особенности состояния и развития изучаемой статистической совокупности.

Под ней понимают расчленение единиц совокупности на однородные группы по определенному существенному для них признаку.

Ее следует проводить на основе глубокого анализа сущности изучаемых явлений. Для ее осуществления устанавливается признак, по которому единицы совокупности определяются в группы. Этот признак называется группировочным (или основанием группировки). Выбор последнего должен согласовываться с задачей, которую эта группировка решает. От правильного выбора группировочного признака зависит ее результат.

Основанием группировки может являться как количественный, так и атрибутивный признак. При проведении сложной группировки в качестве основания выдвигаются несколько группировочных признаков и предыдущий признак является внешним.

Осуществление группировки по количественному признаку начинается с определения числа групп, на которые необходимо разбить совокупность. Оно зависит от:

ü цели исследования

ü объема совокупности

ü размаха вариации признаков совокупности

Проведение группировки по количественному признаку предполагает определение величины интервала признака.

Интервал - числовое значение, с помощью которого определяются границы изменения признака в группе. Интервалы могут быть равными и неравными. При равном интервале группировки величина интервала вычисляется по формуле:

d=(xmax-xmin)/n, где

d - величина интервала,

xmax - максимальное значение признака в группе,

xmin - минимальное значение признака в группе,

xmax-xmin=R - размах вариации

Иногда для определения интервала может быть использована формула Стерджеса (обычно при незначительных вариациях признаков):

d=(xmax-xmin)/(1+lnN), где

N - объем совокупности.

Величину неравных интервалов обычно задает сам исследователь, сообразуя с задачами группировки. Они могут быть прогрессивно возрастающими и убывающими. В большинстве случаев неравные интервалы возрастают и переходят к большим значениям признаков.

Интервалы могут быть открытыми и закрытыми. Открытые имеют одну границу. Они либо открывают либо закрывают группировку. Закрытый интервал имеет две границы: нижнюю и верхнюю. Нижняя указывает на min возможное значение признаков в данной группе, а верхняя - на max.

Метод группировок обычно предшествует всем прочим методам статистического анализа.

Виды группировок

С помощью метода группировок решаются следующие задачи:

þ выделение типов социально-экономических явлений

þ изучение структуры социально-экономических явлений

þ выявление взаимосвязи между явлениями

В связи с этим различают 3 вида группировок:

1) типологические

Распределение численности занятого населения на предприятиях и организациях различных форм собственности (по типам занятости):

Показатели млн. чел.
  90г. 94г.
Всего занято в экономике 75,3 68,5
в том числе:    
На государственных и муниципальных предприятиях и организациях 62,2 30,6
В частном секторе 9,4 22,6
В общественных организациях и фондах 0,6 0,5
На совместных предприятиях 0,1 0,3
На предприятиях и организациях смешанной формы собственности 3,0 14,5

Пример группировки: группировка семей по социально-экономическим типам.

2) структурные

решают задачи по изучению строения (структуры) однородной в качественном отношении статистической совокупности.

Пример: структура денежных доходов/расходов населения.

Денежные расходы всего в том числе:   на покупку   продуктов питания
    непродовольственных товаров
  на оплату услуг:  

Сопоставление данных о структуре совокупности в динамике позволяет проанализировать структурные сдвиги, происшедшие в строении совокупности под воздействием социально-экономических факторов.

3) аналитические

позволяет выявить влияние одних признаков на другие, то есть установить взаимосвязь между ними. Взаимосвязанные признаки делятся на факторные и результативные. В статистике зависимые признаки называются результативными, а признаки, оказывающие влияние, - факторными. При проведении аналитической группировки совокупность разбивается на группы как правило по факторному признаку, а для каждой группы рассчитывается либо среднее значение результативного признака, либо относительная величина, если он качественный. Взаимосвязь при этом проявляется в систематическом изменении результативного признака в связи с изменением признака факторного.

Пример: Потребление фруктов и ягод в домохозяйствах в зависимости от уровня среднедушевого денежного дохода в 1994 г. (децильное распределение(10%)) кг на душу в месяц:

Децильная группа домохозяйств по уровню денежного дохода Потребление фруктов и ягод в кг
1. с наименьшим денежным доходом 1,4
2. 1,7
3. 2,0
4. 2,1
5. 2,3
6. 2,5
7. 2,7
8. 2,9
9. 3,1
10. с наивысшим денежным доходом 3,3

Вторичные группировки

Метод вторичной группировки - прием, используемый в статистическом исследовании для образования новых групп на основе ранее произведенной (первичной) группировки.

К вторичной группировке прибегают:

ÿ если результаты первичной группировки не удовлетворили исслед-ля

ÿ при появлении новых задач исследования

Она производится путем сведения статистических данных в новые группы по тому же признаку, что и первичная. При этом исходная статистическая информация не используется.

При проведении вторичной группировки производится либо дробление интервалов на более мелкие, либо их укрупнение. Осуществляя вторичную группировку, исходят из предположения о равном распределении признака внутри интервала.

Пример: Распределение населения РФ по размерам среднедушевого денежного дохода в 1996 г.

Группы населения по уровню среднедушевого дохода (тыс. руб. в месяц) Население (в % к итогу)
Все население
в том числе со среднедушевым денежным доходом открытый интервал: до 120,0   39,2
120,1 - 240,0 34,1
240,1 - 360,0 14,2
360,1 - 480,0 6,2
480,1 и выше 6,3
Итого:

Для проведения группировки нам необходимо определить новые группы и построить таблицу.

Группы населения по уровню среднедушевого дохода (тыс. руб. в месяц) Население (в % к итогу)
Все население
в том числе со среднедушевым денежным доходом открытый интервал: до 200,0   39,2+34,1/120*80=61,9
200,1 - 400 (34,1-22,7)+14,2+6,2*40/120=27,7
400,1 и выше (6,2-2,1)+6,3=10,4
Итого:

Комбинированные группировки

Комбинированная группировка предполагает расчленение статистической совокупности по 2 и более признакам, взятым в сочетании. При этом сперва образуются группы по первому признаку, затем внутри выделяются подгруппы.

Комбинированная группировка обладает большими аналитическими возможностями, однако следует учитывать, что проведение группировки по большому числу признаков может привести к недостаточной численности единиц в группах. Поэтому к комбинированной группировке прибегают при достаточно большом объеме совокупности. Выбор группировочных признаков диктуется целью группировки.

Ряды распределения

В результате распределения единиц совокупности по величине какого-либо варьирующегося признака получают ряды распределения, которые дают возможность судить о закономерности распределения, однородности статистической совокупности и о границах вариации признаков совокупности. На основе рядов распределения исчисляются различные обобщающие показатели. Ряды распределения могут быть образованы как по атрибутивному, так и по количественным признакам. В зависимости от этогоразличают атрибутивные и вариационные ряды распределения. Они состоят из вариантов признаков и частот.

Пример атрибутивного ряда:

Национальность студента Количество студентов
русские
украинцы
белорусы
молдаване
казахи

Пример: дискретный вариационный ряд распределения:

Оценка Количество студентов

Дискретные ряды основаны на прерывных или дискретных признаках. Графиком является полигон (ОХ - варианты признака, ОУ - частости). График - ломаная кривая, соединяющая все пары чисел, имеющие координатами вариант и частоту.

Интервальные ряды распределения получаются в результате интервальной группировки. Признак в этих рядах распределения варьируется непрерывно внутри интервала. График - гистограмма (ОХ - отрезки, соответствующие границам изменения признака в интервале, ОУ - частоты).

Единицы измерения относительных величин (ОВ)

Часто основание относительных величин (ОВ) приравнивается либо к 1, либо к какому-нибудь другому числу, кратному 10 (100, 1000,10000).

В первом случае относительная величина (ОВ) представляется в виде кратного отношения, показывающего во сколько раз текущая величина (А) больше базисной (В) или какую долю она составляет от второй. Если база сравнения принимается за 100, относительная величина (ОВ) выражается в %, за 1000 - ‰ (промилле), за 10000 - ‰о (продецимилле).

В результате сопоставления разноименных величин получают именованные относительные величины, наименование которых образуется сочетанием наименований сравниваемой и базисной величин (человек/на км2, производство продукции кг/год).

Выбор формы выражения относительной величины (ОВ) зависит от характера данных и результатов, которые получаются при сопоставлении одной величины с другой.

Относительные величины (ОВ) имеют большое значение для социально-экономического анализа, т.к. абсолютная величина (АВ), взятая сама по себе не всегда позволяет дать правильную оценку явлению. Во многих случаях только в сравнении с другой величиной абсолютная величина (АВ) проявляет свою истинную значимость.

Важным свойством относительных величин (ОВ) является то, что они абстрагируют различные абсолютные величины (АВ) и позволяют сравнивать явления, абсолютные размеры которых несопоставимы.

Виды относительных величин (ОВ)

В зависимости от задач, решаемых с помощью относительных величин (ОВ), различают несколько их видов:

Z Относительная величина планового задания (ОВПЗ)

представляет собой отношение установленного показателя на данный период к фактической величине этого показателя, достигнутого в предыдущем периоде.

ОВПЗ=П/Ф0*100%

Пример: Предприятие планировало выпустить в сентябре 240000 пар детской обуви. В августе было выпущено 200000 пар.

ОВПЗ=240000/200000*100%=120%

Предприятие планировало увеличить выпуск на 20%

Z Относительная величина выполнения плана (ОВВП)

выражает соотношение величины показателя фактически достигнутого в текущем периоде (Ф1) к плановому установленному уровню показателя этого же периода (П).

Пример: в сентябре предприятие выпустило 220000 пар обуви при плане 240000 пар.

база сравнения=100%, Ф1=220000, П=240000

ОВВП=Ф1/П=220000/240000=0,92 или 92%

Вывод: предприятие недовыполнило план на 8%

Z Относительная величина динамики (ОВД)

выражает степень изменения явления во времени.

Относительная величина динамики (ОВД) - это отношение фактического уровня показателя за данный период к его фактическому уровню за предыдущий период, либо за какой-то другой период, принятый за базу сравнения.

Относительная величина динамики (ОВД) характеризует направление изменения явления во времени. Скорость этого изменения - темп развития.

ОВД=Ф10 *100%, Ф1 - текущий период, Ф0 - предыдущий период или более ранний

Пример: предприятие выпустило в августе 200000 пар обуви, а в сентябре 220000 пар

ОВД=220000/200000*100%=110%

Фактический выпуск обуви в сентябре превысил фактический выпуск обуви в августе на 10%.

Относительные величины динамики (ОВД) могут быть с постоянной и переменной базой сравнения. Если база сравнения постоянная, то имеем базисную относительную величину динамики (ОВД). Если переменная - цепные относительные величины динамики (ОВД).

Годы показатели
y1
y2
y3
y4
y5
y6
y7
y8

Составляем базисные относительные величины динамики (ОВД): ОВД121, ОВД231, ОВД3=у4/у1- база сравнения постоянная

Базисные относительные величины динамики (ОВД) показывают постепенное изменение показателя, начиная от его начальной базисной величины.

Цепные относительные величины динамики (ОВД): ОВД121, ОВД232, ОВД3= у43 - переменная база

Цепные относительные величины динамики (ОВД) показывают как изменяется величина показателя между соседними периодами времени.

Цепные и базисные относительные величины динамики (ОВД) взаимосвязаны между собой:

B Если последующую базисную относительную величину динамики (ОВД) разделить на предыдущую базисную относительную величину динамики (ОВД), то получим цепную относительную величину динамики (ОВД):

у413143

B Если перемножить рядом стоящие цепные относительные величины динамики (ОВД), получим базисную относительную величину динамики (ОВД):

у213231

Относительная величина динамики (ОВД), относительная величина планового задания (ОВПЗ) и относительная величина выполнения плана (ОВВП) взаимосвязаны между собой:

ОВД=ОВПЗ*ОВВП

Ф10=П/Ф01

Z Относительная величина структуры (ОВС)

представляет собой соотношение части и целого

ОВС=часть/целое*100%

Относительная величина структуры (ОВС) характеризует структуру, состав той или иной совокупности.

Относительные величины структуры (ОВС), исчисленные за несколько периодов времени, дают представления об изменении структуры изучаемого явления (о структурных сдвигах)

Численность населения в 1995г. 148,3 млн.чел.
в том числе мужчин 69,8 млн.чел.
Женщин 78,5 млн.чел.

Доля женщин: ОВС1=78,5/148,3=0,53 или 53%

Доля мужчин: ОВС2=100%-53%=47%

Z Относительная величина координации (ОВК)

выражает соотношение размеров частей целого между собой

Относительная величина координации (ОВК) показывает, сколько единиц одной части целого приходится на одну, 100, 1000, 10000 и т.д. другой его части.

ОВК=часть 1/часть2 - за базу сравнения принимается либо самая маленькая, либо самая большая.

ОВК=69,8 (м)/78,5 (ж)= 0,889 или 889%0 - на каждую 100 женщин приходится 889 мужчин

Возрастные группы

Возрастная группа Количество женщин на 1000 мужчин
15-19 лет
20-24 г.
25-29 лет
35-39 лет
70 лет и старше

Z Относительная величина интенсивности (ОВИ)

характеризует степень распространения явления в данной среде.

Получается в результате соотношения размеров двух качественно различных явлений.

I. размер этого явления

II. среда, где это явление распространено

ОВИ=I/II=размер явления/объем среды

При расчете относительной величины интенсивности (ОВИ) база сравнения может быть равна 1, 100, 1000, 10000 и т.д.

К относительной величине интенсивности (ОВИ) относятся многие демографические показатели:

µ рождаемость

µ смертность

µ брачность

Пример: численность врачей всех специальностей на 1993 г. составляла 663,1 тыс. чел., численность населения 148,4 млн. чел.

ОВИ=663,1/148400=0,004468 или 45%о

На каждые 10000 человек приходилось 45 врачей

Z Относительна величина уровня экономического развития (ОВУЭР)

характеризует производство продукции на душу населения

Величина именованная

Относительная величина уровня экономического развития (ОВУЭР) - отдельный вид относительной величины интенсивности (ОВИ)

Z Относительная величина сравнения (ОВСР)

представляет собой соотношение величин одноименных показателей, относящихся к разным объектам или разным территориям, выражаются в коэффициентах и процентах

Страна Урожайность, ц/кг
Россия
Болгария
Китай
Германия
Дания
Бельгия
Великобритания
Нидерланды

ОВСР=450/101=4,46 или 446%

Если частей не 2, за базу сравнения принимается меньшее

Тема 5. Средние величины.

1. Сущность и задачи средних величин

2. Виды средних аналитических

3. Методика выбора формы средней

4. Свойства средней арифметической

5. Расчет средней методом отсчета от условного нуля упрощенным способом (методом момента)

6. Структурные средние (мода, медиана, дециль, квартиль)

Виды средних аналитических

Существует несколько видов средних аналитических. Выбор конкретного вида и конкретной формулы средней зависит от условий решаемой задачи.

При расчете средних величин необходимо определить признак, по которому находится значение средней. Этот признак называется осредняемым (х).

Средние величины могут рассчитываться по сгруппированным данным (по ряду распределения) и по неупорядоченной совокупности. В зависимости от этого различают:

,взвешенные средние

,невзвешенные (простые) средние

Вес - это частота признака, то есть повторяемость в ряду распределения.

[x] - среднее значение признака

Все формулы средних величин можно получить из формулы степенной средней, меняя показатель степени.

Взвешенные средние Простые средние
x=kÖåxkifi/åfi fi- вес или частота i-того признака xi - значение i-того признака å - объем совокупности x=kÖåxki/n n - объем совокупности
k=-1 Средняя гармоническая
x=åfi/å(fi/xi) w=xf x=åw/å(w/x) - агрегатная фарма x=n/å(1/xi 1 – частота признака
k=0 Средняя геометрическая
x=mÖx1f1*x2f2*..*xnfn m - количество признаков совокупности x=mÖx1*...*xn  
k=1 Средняя арифметическая
x=åxifi/åfi x=åw/åf - агрегатная форма w=xf x=åx/n
k=2 Средняя квадратическая
x=Öåx2f/åf x=Öåx2/n

Мода и медиана

Мода и медиана - две особые разновидности средних величин, которые вытекают из характеристики статистических рядов. Они называются структурными средними и дают некоторое представление о структуре изучаемой совокупности.

При нормальном распределении мода, медиана и средняя совпадают по величине.

Мода и медиана, в отличие от средней, не связаны со всеми значениями признака.

Мода - значение признака наиболее часто встречающееся в ряду распределения или вариант с наибольшей частотой. Мода представляет собой наиболее типичное значение случайной величины.

Для отыскания моды в статистической совокупности необходимо знать распределение единиц совокупности по вариантам признака.

В дискретном вариационном ряду распределения мода определяется визуально, т.е. на глаз.

Оценка
количество студентов

М0=4 fM0=12

При наличии одной моды в ряду распределения распределение называется унимодальным. В ряду распределения может оказаться 2 и более моды. При этом ряд распределения называется соответственно бимодальным и мультимодальным.

Наличие нескольких мод часто означает объединение в одной совокупности разнокачественных единиц и возможность (необходимость в отдельных случаях) разделения последних на подгруппы.

Определение мод в интервальном ряду распределения

В равно интервальном ряду распределения мода определяется по формуле:

M0=x0+d[(fM0-fM0-1)/{(fM0-fM0-1)+(fM0-fM0+1)}]

x0 - нижняя граница модального интервала

d - величина интервала

fM0 - частота модального интервала

fM0-1 - частота интервала, предшествующий. модальному.

fM0+1 - частота интервала, следующего за модальным

х f
0-5
5-10
10-15
15-20
20-25
Итого

М0=5+5(22-8)/[(22-8)+(22-12)]=7,9

После произведения расчетов необходимо проверить, попала ли мода в необходимый интервал.

Медиана - значение признака, приходящееся на середину ранжированного (упорядоченного) ряда. Она делит ряд на 2 равные по объему части. По разному определяется для дискретного и интервального рядов распределения.

Определение медианы в дискретном ряду распределения

1) Размер обуви № наблюдения
 
 
 
 
 
 
 

ме=(7+1)/2 Ме=37

Размер обуви № наблюдения

ме=(6+1)/2=3,5 Ме=(36+37)/2=36,5

2)

Оценка Итого
Кол-тво студентов
0+6 6+8 14+10 24+7    
SH -

Для того чтобы определить медиану необходимо найти накопленные частоты SH.

ме=(n+1)/2=(31+1)/2=16 Ме=4

Децили и квартили

Некоторое представление о структуре изучаемой совокупности дают децили и квартили.

Если медиана - это вариант, который делит упорядоченный ряд на 2 равные по объему группы, то в каждой группе можно найти вариант, делящий ее на 2 равные по объему подгруппы. Эти варианты называются квартилями.

тема 1. предмет и метод статистики - student2.ru

Q1 Me Q3

Q2

Q1<Q2<Q3

Q1-нижняя квартиль

Q2- средняя квартиль, медиана

Q3- верхняя квартиль

При отношении объемов двух подгрупп как 1/4 к 3/4 имеем нижнюю квартильQ1. При отношении объемов 2-х подгрупп как 3/4 к 1/2 имеем верхний квартиль.

Для расчета значения нижнего квартиля в интервальном ряду распределения применяется формула:

Q1=x0(Q1)+d[{(åf)/4-SHQ1-1}/fQ1]

x0(Q1) - нижняя граница квартильного интервала

d - величина интервала

SHQ1-1 - накопленная частота интервала, предшествующая интервалу, содержащему квартиль

fQ1 - частота интервала, содержащая Q1

Для верхнего квартиля:

Q3=x0(Q3)+d[{3(åf)/4-SHQ3-1}/fQ3]

Пример (по примеру о медиане):

Q1=x0(Q1)+d[{(åf)/4-SHQ1-1}/fQ1]=80+20[(250-100)/200]=95 (руб.)

Дециль - вариант, приходящийся на 1/10 объема совокупности. Вычисление децилей аналогично вычислению квартилей и медиан.

При отношении объемов групп как 1/10:9/10 имеем первый дециль.

При отношении объемов групп как 2/10:8/10 имеем второй дециль и т.д.

Формула для вычисления децилей:

D1=x0(D1)+d[{(åf)/10-SHD1-1}/fD1]

x0(D1) - нижняя граница первого децильного интервала

d - величина интервала

(åf)/10 - 1/10объема совокупности

SHD1-1 - накопленная частота, предшествующая интервалу, содержащему 1 дециль

fD1 - частота, соответствующая первому децильному интервалу

D2=x0(D2)+d[{(åf)/10-SHD2-1}/fD2]

ТЕМА 6. ПОКАЗАТЕЛИ ВАРИАЦИИ

1. Сущность и значение вариации

2. Абсолютные показатели вариации (именованные)

3. Относительные показатели вариации

4. Меры вариации для сгруппированных данных

5. Математические свойства дисперсии

6. Расчет дисперсии упрощенным способом

7. Дисперсия альтернативного признака

Правило сложения дисперсии

s2общ=s2+d2

s2общ - за счет всех факторов

s2 - за счет всех факторов, кроме фактора, положенного в основу груп пировки

d2 - за счет фактора, положенного в основу группировки.

Общая дисперсия результативного признака = сумма средней из групповых дисперсий и межгрупповой дисперсии.

Зная значение s2общ и d2, т.е. общей и межгрупповой дисперсий, вычисляют корреляционное отношение: h=Öd2/s2

Корреляционное отношение (h) применяется для оценки степени взаимосвязи между признаками.

d2/s2 - доля межгрупповой дисперсии в общей дисперсии.

Коэффициент детерминации (h2=d2/s2) показывает долю межгрупповой дисперсии в общей дисперсии. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем теснее связаны между собой факторный и результативный признаки.

1³ïhï.Чем ближе ïhï к единице, тем сильнее взаимосвязь между факторным и результативным признаками. Чем ближе ïhï к нулю, тем слабее связь между этими признаками.

Знак корреляционного отношения исследователь ставит самостоятельно, определив характер изменения признака. Если признаки меняются в одном направлении, знак h +, если в разных, то h -.

Рассмотрим некоторые случаи анализа корреляционных отношений и правила сложения дисперсии.

s2общ=s2+d2

h=Öd2/s2

1. Если s2=0, то s2общ=d2, h=ï1ï

Это значит, что вариация результативного признака обусловлена воздействием только фактического признака, положенного в основу группировки, а вариация за счет всех прочих факторов равна нулю.

1.1.Если h=+1, связь между признаками полная прямая

1.2.Если h=-1, связь между признаками полная обратная.

2. d2=0; s2общ=s2

Тогда h=0, это значит , что связь между фактическим признаком, положенным в основу группировки, и результативным признаком отсутствует, т.е. исследователь выбрал факторный признак, оказывающий наибольшее влияние на результативный.

Пример расчета показателя вариации для сгруппированных данных

Групы участков удобрений Урожайность, ц/га Посевная пл-дь,га тема 1. предмет и метод статистики - student2.ru тема 1. предмет и метод статистики - student2.ru тема 1. предмет и метод статистики - student2.ru ¦
Не вносили
Итого по 1 группе - -
Вносили
Итого по 2 группе - -

1) тема 1. предмет и метод статистики - student2.ru

2) тема 1. предмет и метод статистики - student2.ru

3) тема 1. предмет и метод статистики - student2.ru

4) тема 1. предмет и метод статистики - student2.ru

5) тема 1. предмет и метод статистики - student2.ru

6) тема 1. предмет и метод статистики - student2.ru

7) тема 1. предмет и метод статистики - student2.ru

8) тема 1. предмет и метод статистики - student2.ru

9) тема 1. предмет и метод статистики - student2.ru

Графический метод

Предполагает изображение на плоскости множества пар наблюдений (т.е. Х и У). В результате чего получают поле корреляции, позволяющее по концентрации точек сделать предположение о возможной форме связи между факторным и результативным признаками. Если пары наблюдения беспорядочно расположены на поле, то связь отсутствует.

Графический метод позволяет построить поле корреляции и эмпирическую линию регрессии. Эмпирическая линия регрессии строится по средним значениям Х и У. Во многих случаях результаты наблюдения заносятся в корреляционную таблицу, которая также позволяет судить о направлении связи между Х и У. На основе эмпирической линии регрессии делается предположение о форме корреляционной зависимости между Х и У.

Пример:

тема 1. предмет и метод статистики - student2.ru

Парная корреляция

Рассмотрим несколько случаев парной корреляции:

I. Линейная корреляция

Имеет место при равномерном изменении признака. Ломанная линия регрессии позволяет заключить, что уравнение прямой может являться в данном случае уравнением связи. После выбора уравнения связи задача заключается в нахождении параметров уравнения связи. Для их нахождения пользуются методом наименьших квадратов, который основывается на предположении независимости друг от друга отдельных наблюдений. Сущность метода наименьших квадратов основывается на том, что отыскиваются такие зна

Наши рекомендации