Показатели вариации, их значение и способы их расчета.
Вариационные ряды распределения показывают вариацию изучаемых явлений по определенному признаку, однако они не дают обобщающей ее характеристики. Обобщающими показателями являются средние величины, но они нивелируют индивидуальные значения варьирующего признака и различия между ними. А именно они часто и представляют большой интерес с точки зрения наиболее полного раскрытия структуры и общего анализа изучаемой совокупности. Обобщающие показатели вариации разработаны, они могут быть подсчитаны и по вариационному ряду, и по первичному ряду - непосредственно по конкретным исходным данным или ранжированному ряду. Рекомендуется пять таких обобщающих показателей: размах вариации (R), среднее лилейное, или абсолютное отклонение (L), среднее квадратическое отклонение (дисперсия без квадрата), коэффициент вариации (V), дисперсия (дисперсия с квадратом). Важное значение этих показателей можно свести к тому, что они:
а) дополняют средние величины, за которыми скрываются индивидуальные различия;
б) характеризуют степень однородности статистической совокупности по взятому признаку;
в) определяют границы вариации признака;
г) характеризуют взаимосвязь между признаками.
Размах вариации - абсолютная величина разности между максимальным и минимальным значениями (вариантами) взятого признака: R = Xmax – Xmin. Он характеризует пределы изменения варьирующего признака и всецело зависит от колебаний только двух крайних вариантов. Он совершенно не связан с частотами в вариационном ряду, т.е. с характером распределения, что может придать ему неустойчивый, случайный характер.
Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонении отдельных вариантов от их средней арифметической, при этом разности берутся по модулю, т.е. без учета знаков. Формулы следующие: а) для первичного ряда: L(с чертой сверху) = Сигма ABS(x-x(c чертой))/n. б) для вариационного ряда: L(с чертой сверху) = Сигма ABS(x-x(c чертой))*m/Сигма m.
Этот показатель уже не зависит от случайных колебаний вариантов, учитывает всю сумму отклонений конкретных вариантов от среднего показателя. Показатель L - число именованное, его размерность соответствует размерности варьирующего признака.
Среднее квадратическое отклонение: а) для первичного ряда: Корень(Сигма (x-x(c чертой))(в квадрате)/n). б) для вариационного ряда: Корень(Сигма (x-x(c чертой))(в квадрате)*m/Сигма m).
Коэффициент вариации является уже относительным показателем и применяется для сравнения вариации разных признаков. V(дисперсия - нижний индекс) = среднее квадратическое отклонение/X(с чертой)*100%. V представляет собой своеобразную долю среднего отклонения в средней арифметической величине и выражается в процентах. Его универсальность проявляется в том, что он устраняет несопоставимость различных единиц измерения признака и различных величин средних арифметических.
Дисперсия - средний квадрат отклонении индивидуальных значений признака от средней арифметической: Сигма (x-x(c чертой))(в квадрате)/n или при наличии частот: Сигма (x-x(c чертой))(в квадрате)*m/Сигма m. Первая дисперсия для не сгруппированных данных.
21. Правило сложения дисперсий.
Выделяют общую, внутригрупповую и межгрупповую дисперсии. Общая дисперсия характеризует вариацию признака под влиянием всех факторов, вызвавших эту вариацию. Дисперсия (в квадрате) = Сигма ((x-x(c чертой))(в квадрате)*m)/Сигма m. Внутригрупповая дисперсия измеряет вариацию признака внутри группы. Средняя внутригрупповая дисперсия (в квадрате, с чертой сверху) = Сигма((дисперсия в квадрате по i)*ni)/Сигма(ni).
Межгрупповая дисперсия измеряет вариацию изучаемого признака под влиянием признака-фактора (группировочного признака) = Сигма (xi(с чертой)-x(c чертой))(в квадрате)*ni)/Сигма ni.
Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии. Это правило сложения дисперсий, логика которого проста: общая дисперсия, возникающая под влиянием факторов, должна быть равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет фактора группировки. Зная любые два вида дисперсий, всегда можно найти и проверить правильность расчета третьего вида дисперсии.
22. Теория вероятности и выборочный метод в социально-экономических исследованиях.
Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора. При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности. При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью, или просто выборкой.
Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации.
В проведении ряда исследований выборочный метод является единственно возможным, например при контроле качества продукции (товара), если проверка сопровождается уничтожением или разложением на составные части обследуемых образцов.
При соблюдении правил научной организации обследования выборочный метод дает достаточно точные результаты. Большую актуальность имеет выборочный метод в условиях переходного периода и функционирования рыночной экономики.
По сравнению с другими методами, применяющими несплошное наблюдение, выборочный метод имеет важную особенность. В основе отбора единиц для обследования положены принципы равных возможностей попадания в выборку каждой единицы генеральной совокупности. Это предупреждает появление систематических ошибок и делает возможным производить количественную оценку ошибки представительства (репрезентативности).
Применяя выборочный метод в торговле, обычно используют два основных вида обобщающих показателей: относительную величину альтернативного признака и среднюю величину количественного признака. Относительная величина альтернативного признака характеризует долю (удельный вес) единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака. Например, доля нестандартных изделий во всей партии товара. Средняя величина количественного признака - это обобщающая характеристика варьирующего признака, который имеет различные значения у отдельных единиц статистической совокупности. Например, средний образец в товароведении.
В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей (обозначается p), а средняя величина изучаемого варьирующего признака - генеральной средней (обозначается х(c чертой)).
В выборочной совокупности долю изучаемого признака называют выборочной долей, или частостью (обозначается w),
а среднюю величину в выборке - выборочной средней (обозначается х(с волнистой чертой)).
Основная задача выборочного обследования в торговле состоит в том, чтобы на основе характеристик выборочной совокупности (частости w или средней х(с волнистой чертой)) получить достоверные суждения о показателях доли р или средней х в генеральной совокупности.
23. Выборочное статистическое наблюдение. Виды выборок. Ошибки репрезентативности.
Выборочным называется наблюдение заранее определенного числа единиц совокупности, отобранных в особом порядке. Этот порядок призван обеспечить равновозможность попадания в отобранную часть любой из единиц, а следовательно, сам отбор должен быть строго случайным. Цель выборочного наблюдения - по данным об отобранной части единиц совокупности судить о характеристиках всей совокупности. Но для этого отобранная часть должна быть репрезентативной. Таковой считается выборка, в которую входят на правах примерной пропорциональности представители всех групп, имеющихся в генеральной совокупности. Т. е. соблюдаются принципы равновозможности и случайности. От этого во многом зависят ошибки выборки (ошибки репрезентативности), т.е. разности между показателями выборочной и генеральной совокупности. Генеральной в данном случае выступает вся изучаемая совокупность единиц, а выборочной - отобранная в случайном порядке из генеральной совокупности некоторая ее часть.
Специальные этапы его проведения следующие:
а) определение необходимого объема выборки и способа отбора;
б) проведение отбора;
в) обобщение данных наблюдения и расчет выборочных характеристик;
г) расчет ошибок выборки;
д) распространение выборочных характеристик на генеральную совокупность.
Расчет необходимого объема выборки во многом зависит от способа отбора единиц и видов выборки. Под способом отбора понимается порядок отбора единиц из генеральной совокупности. Их два: повторный и бесповторный. При первом каждая отобранная в случайном порядке единица после ее обследования возвращается в генеральную совокупность и при последующем отборе может снова попасть в выборку. При бесповторном отборе каждая отобранная единица в генеральную совокупность не возвращается. Оба способа могут быть реализованы в следующих основных видах выборки: собственно-случайная (по тем же таблицам случайных чисел); механическая (например, по нейтральным спискам единиц отбора); типическая (стратифицированная, районированная); серийная (отбираются целые серии или гнезда и в них обследуются все единицы); комбинированная; многоступенчатая (выборочная совокупность формируется постепенно, по ступеням отбора); многофазная (совокупность формируется из ряда последовательных подвыборок); взаимопроникающая (это две или более независимые выборки из одной и той же совокупности, образованные одним способом и видом). Необходимый объем выборки для собственно-случайного повторного отбора: n=t2*дисперсия2/дельта2.
В практике выборочного наблюдения статистика применяет и малую выборку. Таковой считается выборка, объем которой находится в пределах от 5 до 30 единиц. Она используется в тех случаях, когда практически невозможно организовать ни сплошное наблюдение генеральной совокупности, ни большую выборку. Особенность малой выборки состоит в том, что ее случайные ошибки не подчиняются закону нормального распределения. Здесь действует закон распределения случайных ошибок малой выборки, найденный английским статистиком Стьюдентом. Точность результатов при малой выборке обычно ниже, чем при выборке большого объема. Этими результатами можно пользоваться, если распределение признака в генеральной совокупности является нормальным или близким к нему.
24. Собственно-случайная, средняя и предельная ошибки выборки. Коэффициент доверия.
В любом статистическом наблюдении есть ошибки, обусловленные расхождением его результатов с реальной действительностью. Помимо общих для статистики ошибок регистрации, выборочному наблюдению свойственны и особые ошибки - ошибки репрезентативности. Под ними понимают расхождения между показателями выборочной и генеральной совокупности. Они возникают по двум причинам: из-за нарушения принципа случайности и равновозможности - систематические ошибки -ив результате случайности отбора - случайные ошибки. Первые иногда называют ошибками смещения, они могут быть преднамеренными (при тенденциозном отборе единиц) и непреднамеренными (при подготовке наблюдения, формировании выборочной совокупности). Случайные ошибки носят объективный характер и возникают в результате случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности. Поэтому и структуры этих совокупностей чаще всего не совпадают. С увеличением численности выборки размеры случайных ошибок сокращаются.
Различают среднюю и предельную ошибку выборки. Под средней ошибкой понимают такое расхождение между средними выборочной и генеральной совокупностями (х(с волнистой чертой) – х(с чертой)), которое не превышает среднее квадратическое отклонение. Предельной ошибкой принято считать максимально возможное расхождение этих средних, т.е. максимум ошибки при заданной вероятности ее появления. Средняя ошибка (собственно-случайного повторного отбора), повторная выборка: u=дисперсия/корень(n). Бесповторная: u=корень((дисперсия2/n)*(1-n/N)). Предельная ошибка выборки: дельта = tu. t – коэфициент доверия, зависит от доверительной вероятности, выбранной для исследования. Если t=1, то дельта=u.