Проверка выбранных объектов-аналогов на однородность и нормальное распределение

Статистическая выборка объектов-аналогов должна удовлетворять условиям однородности и нормального распределения. Для проверки этих условий вычисляются:

• Коэффициент вариации;

• Коэффициент асимметрии;

• Коэффициент эксцесса;

• Стандартная ошибка асимметрии;

• Стандартная ошибка эксцесса.

Коэффициент вариации должен быть менее 33%.

Значение отношения коэффициента асимметрии к величине стандартной ошибки асимметрии должно быть не более трех.

Значение отношения коэффициента эксцесса к величине стандартной ошибки эксцесса должно быть не более трех.

Выборка объектов – аналогов проверяется на наличие выбросов.

Проводим описательную статистику по ценам предложения. Для анализа выборки необходимо выполнить описательную статистику по ценам предложений. Определяются следующие величины:

Среднее арифметическое – такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения).

Среднее арифметическое, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Для несгруппированных данных среднее арифметическое определяется по следующей формуле:

Проверка выбранных объектов-аналогов на однородность и нормальное распределение - student2.ru

где n - объем выборки;

хi - варианты выборки.

Среднее арифметическое в MS Excel рассчитывается с использованием функции СРЗНАЧ().

Медиана - это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Для симметричных распределений оценка выборочного среднего и медианы совпадают.

Для несимметричных распределений медиана может давать гораздо лучшую оценку центра группирования, чем выборочное среднее.

Медиана в MS Excel рассчитывается с использованием функции МЕДИАНА().

Мода - наиболее часто встречающаяся величина в выборке. Мода используется для оценки центра группирования несимметричных распределений в выборке. Для малых выборок значение может отсутствовать.

Мода в MS Excel рассчитывается с использованием функции МОДА().

Дисперсия выборки - средний квадрат отклонения значений признака от среднего арифметического. Дисперсия, вычисляемая по выборочным данным, называется выборочной дисперсией и обозначается Проверка выбранных объектов-аналогов на однородность и нормальное распределение - student2.ru . Дисперсия признака определяется на основе квадратической степенной средней:

Проверка выбранных объектов-аналогов на однородность и нормальное распределение - student2.ru

В этой формуле Проверка выбранных объектов-аналогов на однородность и нормальное распределение - student2.ru - сумма квадратов отклонений значений признака xi от среднего арифметического х. Для получения среднего квадрата отклонений эта сумма поделена на объем выборки n.

Дисперсия в MS Excel рассчитывается с использованием функции ДИСП().

Стандартное (среднее квадратическое) отклонение определяется как корень квадратный из дисперсии и оценивает величину отклонения элементов выборки от среднего, т.е. абсолютную меру вариации.

Проверка выбранных объектов-аналогов на однородность и нормальное распределение - student2.ru

Стандартное (среднее квадратическое) отклонение в MS Excel рассчитывается с использованием функций КОРЕНЬ(дисперсия выборки) или СТАНДОТКЛОН().

Размерность стандартного отклонения вотличие от размерности дисперсии совпадает с единицами измерения варьирующего признака, поэтому в практической статистике для того, чтобы охарактеризовать рассеяние признака используют обычно стандартное отклонение, а не дисперсию.

Размах вариации (диапазон, максимальное расстояние) - разница между наибольшим и наименьшим значениями выборки. Размах вариации (диапазон, максимальное расстояние) в MS Excel рассчитывается с использованием функций МАКС() - МИН().

Минимум- наименьшее значение выборки. Минимум в MS Excel рассчитывается с использованием функции МИН().

Максимум - наибольшее значение выборки. Максимум в MS Excel рассчитывается с использованием функции МАКС().

Один из показателей размаха и интенсивности вариации - среднее линейное отклонение (средний модуль отклонения) от среднего арифметического. Среднее линейное отклонение рассчитывается по формуле:

Проверка выбранных объектов-аналогов на однородность и нормальное распределение - student2.ru

Среднее линейное отклонение (средний модуль отклонения) в MS Excel рассчитывается с использованием функции СРОТКЛ().

Количество выборки - размер выборки используемой в данной процедуре. Количество выборки в MS Excel рассчитывается с использованием функции СЧЕТ().

Для проверки выборки на соответствие генеральной совокупностирассчитываются следующие показатели:

Коэффициент вариации используется и как показатель однородности выборочных наблюдений, определяется как отношение среднеквадратического отклонения к среднему значению. Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического:

Проверка выбранных объектов-аналогов на однородность и нормальное распределение - student2.ru

Коэффициент вариации является относительной мерой рассеяния признака.

Коэффициент вариации используется и как показатель однородности выборочных наблюдений. Считается, что если коэффициент вариации не превышает 10 %, то выборку можно считать однородной, т. е. полученной из одной генеральной совокупности. Чем больше значение коэффициента вариации, тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений (выбросов).

Коэффициент вариации в MS Excel рассчитывается с использованием функций

СТАНДОТКЛОН() / СРЗНАЧ().

Наши рекомендации