Статистический анализ результатов имитационного эксперимента

В анализе стохастических процессов важное значение имеют статистические взаимосвязи между случайными величинами. В предыдущем примере для установления степени взаимосвязи ключевых и расчетных показателей мы использовали графический анализ. В качестве количественных характеристик подобных взаимосвязей в статистике используют два показателя: ковариацию и корреляцию.

Ковариация и корреляция

Ковариация выражает степень статистической зависимости между двумя множествами данных и определяется из следующего соотношения:

Статистический анализ результатов имитационного эксперимента - student2.ru

где X, Y - множества значений случайных величин размерности m; M(X) - математическое ожидание случайной величины Х; M(Y) - математическое ожидание случайной величины Y.

Как следует из формулы, положительная ковариация наблюдается в том случае, когда большим значениям случайной величины Х соответствуют большие значения случайной величины Y, т.е. между ними существует тесная прямая взаимосвязь. Соответственно отрицательная ковариация будет иметь место при соответствии малым значениям случайной величины Х больших значений случайной величины Y. При слабо выраженной зависимости значение показателя ковариации близко к 0.

Ковариация зависит от единиц измерения исследуемых величин, что ограничивает ее применение на практике. Более удобным для использования в анализе является производный от нее показатель - коэффициент корреляции R, вычисляемый по формуле:

Статистический анализ результатов имитационного эксперимента - student2.ru

Коэффициент корреляции обладает теми же свойствами, что и ковариация, однако является безразмерной величиной и принимает значения от -1 (характеризует линейную обратную взаимосвязь) до +1 (характеризует линейную прямую взаимосвязь). Для независимых случайных величин значение коэффициента корреляции близко к 0.

Определение количественных характеристик для оценки тесноты взаимосвязи между случайными величинами в ППП EXCEL может быть осуществлено двумя способами:

- с помощью статистических функций КОВАР()и КОРРЕЛ();

- с помощью специальных инструментов статистического анализа.

Если число исследуемых переменных больше 2, более удобным является использование инструментов анализа.

Инструмент анализа данных "Корреляция"

Определим степень тесноты взаимосвязей между переменными V, Q, P, NCF и NPV. При этом в качестве меры будем использовать показатель корреляции R.

1. Выберите "Анализ данных". Выберите из списка "Инструменты анализа" пункт "Корреляция" и нажмите кнопку "ОК" (рисунок 3.1). Результатом будет появление окна диалога инструмента "Корреляция".

2. Заполните поля диалогового окна, как показано на рисунке 3.2.

Вид полученной ЭТ после выполнения элементарных операций форматирования приведен на рисунке 3.3.

Статистический анализ результатов имитационного эксперимента - student2.ru

Рис.3.1. Список инструментов анализа (выбор пункта "Корреляция")

Статистический анализ результатов имитационного эксперимента - student2.ru

Рис.3.2. Заполнение окна диалога инструмента "Корреляция"

Статистический анализ результатов имитационного эксперимента - student2.ru

Рис. 3.3. Результаты корреляционного анализа

Результаты корреляционного анализа представлены в ЭТ в виде квадратной матрицы, заполненной только наполовину, поскольку значение коэффициента корреляции между двумя случайными величинами не зависит от порядка их обработки. Нетрудно заметить, что эта матрица симметрична относительно главной диагонали, элементы которой равны 1, так как каждая переменная коррелирует сама с собой.

Как следует из результатов корреляционного анализа, выдвинутая в процессе решения предыдущего примера гипотеза о независимости распределений ключевых переменных V, Q, P в целом подтвердилась. Значения коэффициентов корреляции между переменными расходами V, количеством Q и ценой Р (ячейки В3:В4, С4) достаточно близки к 0.

В свою очередь величина показателя NPV напрямую зависит от величины потока платежей (R = 1). Кроме того, существует корреляционная зависимость средней степени между Q и NPV (R = 0,548), P и NPV (R = 0,67). Как и следовало ожидать, между величинами V и NPV существует умеренная обратная корреляционная зависимость (R = -0,39).

Полезность проведения последующего статистического анализа результатов имитационного эксперимента заключается также в том, что во многих случаях он позволяет выявить некорректности в исходных данных, либо даже ошибки в постановке задачи. В частности в рассматриваемом примере, отсутствие взаимосвязи между переменными затратами V и объемами выпуска продукта Q требует дополнительных объяснений, так как с увеличением последнего, величина V также должна расти . Таким образом, установленный диапазон изменений переменных затрат V нуждается в дополнительной проверке и, возможно, корректировке.

Следует отметить, что близкие к нулевым значения коэффициента корреляции R указывают на отсутствие линейной связи между исследуемыми переменными, но не исключают возможности нелинейной зависимости. Кроме того, высокая корреляция не обязательно всегда означает наличие причинной связи, так как две исследуемые переменные могут зависеть от значений третьей.

При проведении имитационного эксперимента и последующего вероятностного анализа полученных результатов мы исходили из предположения о нормальном распределении исходных и выходных показателей. Вместе с тем, справедливость сделанных допущений, по крайней мере для выходного показателя NPV, нуждается в проверке.

Для проверки гипотезы о нормальном распределении случайной величины применяются специальные статистические критерии: Колмогорова-Смирнова, c ². В целом ППП EXCEL позволяет быстро и эффективно осуществить расчет требуемого критерия и провести статистическую оценку гипотез.

Инструмент анализа данных "Описательная статистика"

Чем больше характеристик распределения случайной величины нам известно, тем точнее мы можем судить об описываемых ею процессов. Инструмент "Описательная статистика" автоматически вычисляет наиболее широко используемые в практическом анализе характеристики распределений. При этом значения могут быть определены сразу для нескольких исследуемых переменных.

Определим параметры описательной статистики для переменных V, Q, P, NCF, NPV. Для этого необходимо выполнить следующие шаги.

1. "Анализ данных". Выберите из списка "Инструменты анализа" пункт "Описательная статистика".

2. Заполните поля диалогового окна, как показано на рисунке 3.4 и нажмите кнопку "ОК".

Результатом выполнения указанных действий будет формирование отдельного листа, содержащего вычисленные характеристики описательной статистики для исследуемых переменных. Выполнив операции форматирования, можно привести полученную ЭТ к более наглядному виду (рисунок 3.5).

Многие из приведенных в данной ЭТ характеристик вам уже хорошо знакомы, а их значения уже определены с помощью соответствующих функций на листе "Результаты анализа". Поэтому рассмотрим лишь те из них, которые не упоминались ранее.

Вторая строка ЭТ содержит значения стандартных ошибок e для средних величин распределений. Другими словами среднее или ожидаемое значение случайной величины М(Е) определено с погрешностью ± e .

Статистический анализ результатов имитационного эксперимента - student2.ru

Рис. 3.4. Заполнение полей диалогового окна "Описательная статистика"

Статистический анализ результатов имитационного эксперимента - student2.ru

Рис.3.5. Описательная статистика для исследуемых переменных

Медиана - это значение случайной величины, которое делит площадь, ограниченную кривой распределения, пополам (т.е. середина численного ряда или интервала). Как и математическое ожидание, медиана является одной из характеристик центра распределения случайной величины. В симметричных распределениях значение медианы должно быть равным или достаточно близким к математическому ожиданию.

Как следует из полученных результатов, данное условие соблюдается для исходных переменных V, Q, P (значения медиан лежат в диапазоне М(Е) ± e , т.е. - практически совпадают со средними). Однако для результатных переменных NCF, NPV значения медиан лежат ниже средних, что наводит на мысль о правосторонней асимметричности их распределений.

Мода - наиболее вероятное значение случайной величины (наиболее часто встречающееся значение в интервале данных). Для симметричных распределений мода равна математическому ожиданию. Иногда мода может отсутствовать. В данном случае ППП EXCEL вернул сообщение об ошибке. Таким образом, вычисление моды не представляется возможным.

Эксцесс характеризует остроконечность (положительное значение) или пологость (отрицательное значение) распределения по сравнению с нормальной кривой. Теоретически, эксцесс нормального распределения должен быть равен 0. Однако на практике для генеральных совокупностей больших объемов его малыми значениями можно пренебречь.

В рассматриваемом примере примерно одинаковый положительный эксцесс наблюдается у распределений переменных Q, NCF, NPV. Таким образом графики этих распределений будут чуть остроконечнее, по сравнению с нормальной кривой. Соответственно графики распределений для переменных V и Р будут чуть более пологими, по отношению к нормальному.

Асимметричность (коэффициент асимметрии или скоса - s) характеризует смещение распределения относительно математического ожидания. При положительном значении коэффициента распределение скошено вправо, т.е. его более длинная часть лежит правее центра (математического ожидания) и обратно. Для нормального распределения коэффициент асимметрии равен 0. На практике, его малыми значениями можно пренебречь.

В частности асимметрию распределений переменных V, Q, P в данном случае можно считать несущественной, чего нельзя однако сказать о распределении величины NPV.

Осуществим оценку значимости коэффициента асимметрии для распределения NPV. Наиболее простым способом получения такой оценки является определение стандартной (средней квадратической) ошибки асимметрии, рассчитываемой по формуле:

Статистический анализ результатов имитационного эксперимента - student2.ru

где n - число значений случайной величины (в данном случае 500).

Если отношение коэффициента асимметрии s к величине ошибки s _as меньше трех (т.е.: s /s _as < 3), то асимметрия считается несущественной, а ее наличие объясняется воздействием случайных факторов. В противном случае асимметрия статистически значима и факт ее наличия требует дополнительной интерпретации. Осуществим оценку значимости коэффициента асимметрии для рассматриваемого примера.

Введите в любую ячейку ЭТ формулу:

= 0,763 / КОРЕНЬ(6*499 / 501*503) (Результат: 7,06).

Поскольку отношение s /s _as > 3, асимметрию следует считать существенной. Таким образом наше первоначальное предположение о правосторонней скошенности распределения NPV подтвердилась.

Для рассматриваемого примера наличие правосторонней асимметрии может считаться положительным моментом, так как это означает, что большая часть распределения лежит выше математического ожидания, т.е. большие значения NPV являются более вероятными.

Аналогичным способом можно осуществить проверку значимости величины эксцесса е. Формула для расчета стандартной ошибки эксцесса имеет следующий вид:

Статистический анализ результатов имитационного эксперимента - student2.ru

где n - число значений случайной величины.

Если отношение e /s _ex < 3, эксцесс считается незначительным и его величиной можно пренебречь.

Величина "Интервал"определяется как разность между максимальным и минимальным значением случайной величины (численного ряда). Параметры "Счет"и "Сумма"представляют собой число значений в заданном интервале и их сумму соответственно.

Последняя характеристика "Уровень надежности" показывает величину доверительного интервала для математического ожидания согласно заданному уровню надежности или доверия.По умолчанию уровень надежности принят равным 95%.

Для рассматриваемого примера это означает, что с вероятностью 0,95 (95%) величина математического ожидания NPV попадет в интервал 3412,14 ± 224,88.

Вы можете указать другой уровень надежности, например - 98%, путем ввода соответствующего значения в поле "Уровень надежности" диалогового окна "Описательная статистика". Следует отметить, что чем выше принятый уровень надежности, тем больше будет величина доверительного интервала для среднего.

В заключении отметим, что имитационное моделирование позволяет учесть максимально возможное число факторов внешней среды для поддержки принятия управленческих решений и является наиболее мощным средством анализа инвестиционных рисков. Необходимость его применения в отечественной финансовой практике обусловлена особенностями российского рынка, характеризующегося субъективизмом, зависимостью от внеэкономических факторов и высокой степенью неопределенности.

Результаты имитации могут быть дополнены вероятностным и статистическим анализом и в целом обеспечивают менеджера наиболее полной информацией о степени влияния ключевых факторов на ожидаемые результаты и возможных сценариях развития событий.

Задание к лабораторной работе № 2

1. Выполните задания из теоретической части.

2. Используйте варианты индивидуальных заданий из предыдущей лабораторной работы для получения показателей корреляции и описательной статистики.

3. Сформируйте отчет. Прокомментируйте каждый показатель.

Лабораторная работа № 3