Сущность закона больших чисел.
Сущность закона больших чисел.
Изучаемые статистикой закономерности – формы проявления причинной связи – выражаются в повторяемости с определённой регулярностью событий с достаточно высокой степенью вероятности. При этом должно соблюдаться условие, что факторы, порождающие события, изменяются незначительно или не меняются вообще. Статистическая закономерность обнаруживается на основе анализа массовых данных, подчиняется закону больших чисел.
Сущность закона больших чисел заключается в том, что в сводных статистических характеристиках (суммарное число, получаемое в результате массового наблюдения) действия элементов случайности погашаются, а выступают в них определённые правильности (тенденции), которые не могут быть обнаружены на небольшом числе фактов.
Закон больших чисел порождён связями массовых явлений. Необходимо помнить, что тенденции и закономерности, вскрытые с помощью закона больших чисел, имеют силу только как массовые тенденции, но не как законы для индивидуальных единиц, для отдельных случаев.
Ошибки статистического наблюдения.
Отклонения между исчисленными в результате наблюдения показателями и действительными величинами исследуемых явлений называются ошибками (погрешностями) статистических наблюдений. Выделяют 2 вида ошибок статистического наблюдения:
1) ошибки регистрации (при сплошном и несплошном наблюдении):
а) случайные – ошибки при регистрации со слов (не тот возраст);
б) систематические преднамеренные – специальные искажения данных в отчётах (объём выпущенной продукции)
в) систематические непреднамеренные – небрежность, неисправность техники.
2) ошибки репрезентативности (представительности) – только при несплошном наблюдении. Возникают, если состав отобранных для наблюдения единиц совокупности недостаточно полно отражает состав всей совокупности:
а) случайные – когда совокупность отображаемых единиц неполно воспроизводит всю совокупность. Оцениваются математическими методами;
б) систематические – отклонения вследствие нарушения принципа случайного отбора единиц совокупности. Не определятся количественно.
Все ошибки при регистрации могут быть проверены – расчётно или логически.
Перепись как специально организованное статистическое наблюдение.
Перепись – специально организованное статистическое наблюдение, основная задача которого состоит в учёте численности и характеристике состава изучаемого явления путём записи в статистический формуляр по обследованным единицам статистической совокупности.
Различают 2 вида переписей:
1) перепись на основе материалов первичного учёта – единовременный учёт: перепись остатков материалов, оборудования;
2) перепись на основе специально организованной регистрации фактов: перепись населения.
Перепись населения – научно организованное статистическое наблюдение для получения данных о численности, составе и размещении населения.
Программа переписи – излагается в переписном листе, либо индивидуальном для одного человека, либо на несколько человек (семью, квартиру). Переписные листы 1979г, 1989г. одновременно являлись носителями для ЭВМ.
Даты переписей населения: 1939, 1959, 1979, 1989 гг.
Сейчас распространены микропереписи – социально-демографические обследования.
Последняя проводилась на 14.02.94 г. на 12 ч. ночи, ею было охвачено 5% населения: В течение 10 дней специально подготовленными счётчиками обследовался каждый 20-й портфель (счётный участок – по переписи 1989 г. – это приблизительно 300 человек, т.е. квартал, жилой дом).
В 1999г., по составлению на 10.11.99 г. планировалась сплошная перепись населения России. Она была отменена по финансовым причинам и перенесена на 9-16 октября 2002 г. Учитываться будет наличное и постоянное население, в том числе временно отсутствующие и временно проживающие граждане России.
Для этого Госдумой РФ должен быть принят Федеральный закон о переписи населения. Будут привлекаться счётчики: через службы занятости (финансирование из республиканского бюджета) и др. работники – за счёт местного бюджета.
Абсолютные величины.
Абсолютные величины получают в результате проведения статистического наблюдения и сводки. Они выражают физические размеры изучаемых явлений и процессов, то есть массу, площадь, объем, протяженность, временные характеристики, а также объем совокупности (численность единиц). Например, территория Омской области составляет 139,7 тыс. кв. километров; численность постоянного населения области на 01.01.2000г. – 2164,0 тыс. человек; объем промышленного производства за 1999г. – 16995 млн. рублей.
Абсолютные показатели всегда являются именованными числами, то есть имеют конкретные единицы измерения. В зависимости от сущности изучаемых явлений и их физических свойств, абсолютные величины выражаются в натуральных, трудовых и стоимостных единицах измерения.
В международной практике применяются натуральные величины измерения: тонны, килограммы, метры, квадратные метры, кубические метры, километры, мили, литры, баррели, штуки и т. д..
В тех случаях, когда продукт имеет несколько разновидностей и его общий объем можно определить только исходя из единого для всех них потребительского свойства, применяют условно-натуральные измерители (например, различные виды органического топлива переводятся в условное топливо с теплотой сгорания 29,3 мДж/кг (7000ккал/кг)). Перевод в условные единицы производится через специальные коэффициенты, рассчитываемые как отношение потребительских свойств разновидностей продукта к эталонному значению.
Трудовые единицы измерения позволяют учитывать общие затраты труда и трудоемкость отдельных операций технологического процесса, к ним относятся человеко-дни и человеко-часы.
Стоимостные единицы измерения дают денежную оценку изучаемым явлениям и процессам, к ним относятся рубли, тысячи рублей, миллионы рублей, валюты других стран.
Относительные величины.
В статистической практике широко применяются относительные показатели. Относительная величина – это результат деления двух абсолютных величин, который характеризует количественное соотношение между ними. По отношению к абсолютным показателям относительные величины являются производными, вторичными. Абсолютный показатель, находящийся в числителе отношения, называется текущим или сравниваемым. Показатель, который находится в знаменателе, называется основанием или базой сравнения. Относительные показатели могут выражаться в коэффициентах, процентах (0/0, база = 100), промилле (0/00, база = 1000), децимилле (0/000, база = 10000) или быть именованными числами (например, руб./руб.).
Относительные статистические показатели подразделяются на следующие виды:
1) относительная величина планового задания;
2) относительная величина выполнения плана (договорных обязательств);
3) относительная величина структуры;
4) относительная величина динамики;
5) относительная величина сравнения;
6) относительная величина координации;
7) относительная величина интенсивности.
Понятие вариации.
Каждый изучаемый объект находится в конкретных условиях и развивается со своими особенностями под влиянием различных факторов. Это развитие выражается числовыми уровнями статистических показателей, в частности, средними характеристиками.
Вариация – это несовпадение уровней одного показателя у разных объектов. Вариация признака – различие индивидуальных значений признака внутри совокупности. Характеризует однородность совокупности. Показатели вариации служат для её измерения, в частности, измеряют отклонение (вариацию) индивидуальных значений признака внутри изучаемой совокупности от средних величин, показывают надёжность средних характеристик. Таким образом, при анализе исследуемой совокупности, полученные средние величины необходимо дополнить показателями, измеряющими отклонения от средних и показывающих степень их надёжности, т.е. показателями вариации.
Статистика изучает не все различия значений конкретного признака, а только количественные изменения величины признака в пределах однородной совокупности, которые вызваны пересекающимся влиянием различных факторов.
Различают случайную и систематическую вариацию признака. Статистика изучает систематическую вариацию. Её анализ позволяет оценить степень зависимости изменений изучаемого признака от различных факторов, вызывающих эти изменения.
Определив характер вариации в исследуемой совокупности, можно сказать, насколько она однородна, и следовательно, насколько характерной является рассчитанная средняя величина.
Степень близости отдельных единиц к средней измеряется рядом абсолютных, средних и относительных показателей вариации.
Понятие ошибки выборки.
Обобщающие показатели у части единиц совокупности не будут совпадать с соответствующими показателями совокупности всех единиц. Одной из задач выборочного наблюдения является определение пределов отклонений характеристик выборочной совокупности и генеральной совокупности.
Возможные пределы отклонений генеральной и выборочной долей, а также генеральных и выборочных средних, называются ошибкой выборки (ошибкой репрезентативности). Чем она меньше, тем точнее показатели выборочного наблюдения отражают генеральную совокупность.
Ошибки выборки бывают:
1) тенденциозными – это преднамеренные ошибки, если специально отбираются или худшие единицы совокупности;
2) случайными – возникают вследствие случайности отбора, т.к. единицы из совокупности выбираются в случайном порядке, могут быть преувеличены или характеристики генеральной совокупности.
Ошибка выборки зависит от численности выборки и от степени варьирования изучаемого признака. Все возможные расхождения между характеристиками выборочной и генеральной совокупности аккумулируются в формуле средней ошибки выборки. Она рассчитывается по-разному в зависимости от способа отбора: повторный или бесповторный.
При повторном отборе каждая попавшая в выборку единица после фиксации значения изучаемого признака возвращается в генеральную совокупность и может быть опять случайно отобрана.
На практике чаще применяется бесповторный отбор, когда отобранные единицы в генеральную совокупность не возвращаются.
Повторный отбор:
1) для показателя средней величины количественного варьирующего признака: (1),
2) для показателя доли альтернативного признака: (2),
Бесповторный отбор.
При этом способе отбора численность единиц генеральной совокупности сокращается в процессе выборки, поэтому:
1) для показателя средней величины количественного признака: (3),
2) для показателя доли альтернативного признака: (4)
По правилам математической статистики значение средней ошибки выборки должно определяться не через выборочную дисперсию, а через генеральную дисперсию, но она, чаще всего, на практике при проведении выборочного обследования бывает неизвестна.
Доказано, что (5)
при достаточно большом значении n ( ) отношение близко к единице, т.е. при соблюдении принципа случайного отбора дисперсия большого объёма выборки близка к дисперсии в генеральной совокупности. Поэтому на практике для определения средней ошибки выборки обычно применяют дисперсию выборочную.
Приведённые формулы (1),(2),(3),(4) позволяют определить среднюю величину отклонений, равную , характеристик генеральной совокупности от выборочных характеристик. Доказано, что генеральные характеристики отклоняются от выборочных на величину ±μ с вероятностью равной 0,638. Это означает, что в 683 случаях из 1000 генеральная доля (генеральная средняя) будет находиться в пределах ±μ от выборочной доли (выборочной средней) , а в 317 случаях выйдет за эти пределы.
Вероятность суждений можно повысить, а границы характеристик генеральной совокупности расширить, если увеличить среднюю ошибку выборки в несколько раз (t раз, t=2,3,4...).
Величина, полученная как произведение t и средней ошибки выборки, называется предельной ошибкой выборки, т.е.
(6) и (7), где
t – коэффициент доверия, он зависит от вероятности, с которой можно гарантировать, что предельная ошибка не превысит t-кратную среднюю ошибку, находится по готовым таблицам функции F(t), определённой русским математиком А.М.Ляпуновым применительно к нормальному распределению.
На практике часто применяется несплошное обследование, при котором выборка образуется из небольшого числа единиц генеральной совокупности, обычно, не больше 30 единиц. Такая выборка называется малой выборкой.
Средняя ошибка малой выборки определяется по формуле: (8)
Так как при малой выборке отношение имеет существенное значение, дисперсия малой выборки определяется с учётом числа степеней свободы. Под ним понимается количество вариантов, которые могут принимать произвольные значения, не меняя величины средней, оно обычно для малой выборки =(n-1):
(9), (10) Зная доверительную вероятность малой выборки (обычно, 0,95 или 0,99) и численность выборки n, можно определить величину t по специальной таблице Стьюдента.
Средние индексы.
Любой общий индекс можно представить как среднюю взвешенную из индивидуальных индексов (вторая форма выражения общих индексов). При этом форму средней нужно выбрать таким образом, чтобы полученный средний индекс был тождественен исходному агрегатному индексу. Применяются две формы: средняя арифметическая форма и средняя геометрическая форма (для расчета общих индексов).
1)В тех случаях когда отсутствуют данные о количестве товаров (продукции) в натуральных измерителях, но есть информация о стоимости реализованных товаров (произведенной продукции) и индивидуальные индексы изменения объемов товаров (продукции), можно определить агрегатный индекс физического объема товарооборота (продукции) по средней арифметической форме .
(24) , где
Чтобы средний арифметический индекс был тождественен агрегатному, весами индивидуальных индексов в нем должны быть взяты слагаемые знаменателя исходного агрегатного индекса.
2)В тех случаях, когда нет информации о количестве товаров (продукции) в натуральной форме, но есть учет реализации товаров (производства продукции) в стоимостном выражении и индивидуальные цены на товары (продукцию), для определения сводных показателей изменения цен применяется средняя гармоническая форма.
(25) , где
Чтобы средний гармонический индекс был тождественен агрегатному, весами индивидуальных индексов в нем должны быть взяты слагаемые числителя исходного агрегатного индекса.
Территориальные индексы.
Территориальные индексы служат для сравнения показателей в пространстве, то есть по предприятиям, городам, регионам и т. п.
Построение территориальных индексов определяется выбором базы сравнения и весов или уровня, на котором фиксируются веса. При двусторонних сравнениях каждая территория может быть сравниваемой (числитель индекса) и базой сравнения (знаменатель). Веса и первой и второй территории могут быть использованы при расчете индекса, но это может привести к противоречивым результатам. Поэтому предлагается два способа расчета территориальных индексов.
1) В качестве весов принимаются объемы проданных товаров (произведенной продукции) по двум вместе взятым регионам: (33)
Территориальный индекс цен тогда имеет вид:
(34) , где Ра, Рв – цена единицы товара (продукции) на территориях а и в.
В качестве весов здесь можно использовать структуру продажи данных товаров (продукции) по более крупной территории (республике, например).
2) При втором способе расчета учитывается соотношение весов сравниваемых территорий. Рассчитывается средняя цена каждого товара по двум территориям вместе:
(35) , потом индекс цен (36)
Данный подход к расчету территориального индекса цен обеспечивает взаимосвязь:
Индекс физического объема товарооборота (производства) имеет вид:
.(37)
Тогда система индексов имеет вид:
(38)
Цепные и базисные индексы.
При изучении динамики социально-экономических явлений часто производятся сопоставления более чем за два периода.
- Если необходимо проанализировать изменение явления во всех последних периодах по сравнению с начальным (базовым) – вычисляются базисные индексы.
- Если требуется охарактеризовать последовательное изменение явления, из периода в период, то рассчитываются цепные индексы.
В зависимости от характера исходной информации и задач исследования можно рассчитать как индивидуальные так и общие индексы.
Индивидуальные цепные и базисные индексы рассчитываются аналогично относительным величинам динамики (темпам роста).
Общие индексы вычисляются с переменными и постоянными весами, в зависимости от их экономического содержания.
Общие индексы качественных показателей (цен, себестоимости, производительности труда) исчисляются как индексы с переменными весами (то есть весы берутся на уровне текущего – отчетного периода).
Общие индексы количественных показателей (физического объема) рассчитываются как индексы с постоянными весами, взятыми на уровне базисного (начального периода).
При этом общие цепные и базисные индексы с постоянными весами находятся во взаимосвязи:
a) Произведение цепных индексов дает базисный индекс последнего периода;
b) Деление последующего базисного индекса на предыдущий базисный индекс дает цепной индекс последующего периода.
В этих индексах весы – соизмерители взяты на уровне одного и того же базисного периода.
Общие цепные и базисные индексы с переменными весами такой взаимосвязи не имеют, так как в них весы – соизмерители берутся на уровнях разных периодов. Для всех индивидуальных индексов взаимосвязь цепных и базисных индексов сохраняется.
Индивидуальный
цепные базисные 1,25*1,2=1,5 - сохраняется
1. Общие индексы цен:
a) цепные
базисные
2. Общие индексы физического объема:
a) цепные
базисные
Сущность закона больших чисел.
Изучаемые статистикой закономерности – формы проявления причинной связи – выражаются в повторяемости с определённой регулярностью событий с достаточно высокой степенью вероятности. При этом должно соблюдаться условие, что факторы, порождающие события, изменяются незначительно или не меняются вообще. Статистическая закономерность обнаруживается на основе анализа массовых данных, подчиняется закону больших чисел.
Сущность закона больших чисел заключается в том, что в сводных статистических характеристиках (суммарное число, получаемое в результате массового наблюдения) действия элементов случайности погашаются, а выступают в них определённые правильности (тенденции), которые не могут быть обнаружены на небольшом числе фактов.
Закон больших чисел порождён связями массовых явлений. Необходимо помнить, что тенденции и закономерности, вскрытые с помощью закона больших чисел, имеют силу только как массовые тенденции, но не как законы для индивидуальных единиц, для отдельных случаев.