Проверка выбранных объектов-аналогов на однородность и нормальное распределение
Статистическая выборка объектов-аналогов должна удовлетворять условиям однородности и нормального распределения. Для проверки этих условий вычисляются:
• Коэффициент вариации;
• Коэффициент асимметрии;
• Коэффициент эксцесса;
• Стандартная ошибка асимметрии;
• Стандартная ошибка эксцесса.
Коэффициент вариации должен быть менее 33%.
Значение отношения коэффициента асимметрии к величине стандартной ошибки асимметрии должно быть не более трех.
Значение отношения коэффициента эксцесса к величине стандартной ошибки эксцесса должно быть не более трех.
Выборка объектов – аналогов проверяется на наличие выбросов.
Проводим описательную статистику по ценам предложения. Для анализа выборки необходимо выполнить описательную статистику по ценам предложений. Определяются следующие величины:
Среднее арифметическое – такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения).
Среднее арифметическое, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.
Для несгруппированных данных среднее арифметическое определяется по следующей формуле:
где n - объем выборки;
хi - варианты выборки.
Среднее арифметическое в MS Excel рассчитывается с использованием функции СРЗНАЧ().
Медиана - это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Для симметричных распределений оценка выборочного среднего и медианы совпадают.
Для несимметричных распределений медиана может давать гораздо лучшую оценку центра группирования, чем выборочное среднее.
Медиана в MS Excel рассчитывается с использованием функции МЕДИАНА().
Мода - наиболее часто встречающаяся величина в выборке. Мода используется для оценки центра группирования несимметричных распределений в выборке. Для малых выборок значение может отсутствовать.
Мода в MS Excel рассчитывается с использованием функции МОДА().
Дисперсия выборки - средний квадрат отклонения значений признака от среднего арифметического. Дисперсия, вычисляемая по выборочным данным, называется выборочной дисперсией и обозначается . Дисперсия признака определяется на основе квадратической степенной средней:
В этой формуле - сумма квадратов отклонений значений признака xi от среднего арифметического х. Для получения среднего квадрата отклонений эта сумма поделена на объем выборки n.
Дисперсия в MS Excel рассчитывается с использованием функции ДИСП().
Стандартное (среднее квадратическое) отклонение определяется как корень квадратный из дисперсии и оценивает величину отклонения элементов выборки от среднего, т.е. абсолютную меру вариации.
Стандартное (среднее квадратическое) отклонение в MS Excel рассчитывается с использованием функций КОРЕНЬ(дисперсия выборки) или СТАНДОТКЛОН().
Размерность стандартного отклонения вотличие от размерности дисперсии совпадает с единицами измерения варьирующего признака, поэтому в практической статистике для того, чтобы охарактеризовать рассеяние признака используют обычно стандартное отклонение, а не дисперсию.
Размах вариации (диапазон, максимальное расстояние) - разница между наибольшим и наименьшим значениями выборки. Размах вариации (диапазон, максимальное расстояние) в MS Excel рассчитывается с использованием функций МАКС() - МИН().
Минимум- наименьшее значение выборки. Минимум в MS Excel рассчитывается с использованием функции МИН().
Максимум - наибольшее значение выборки. Максимум в MS Excel рассчитывается с использованием функции МАКС().
Один из показателей размаха и интенсивности вариации - среднее линейное отклонение (средний модуль отклонения) от среднего арифметического. Среднее линейное отклонение рассчитывается по формуле:
Среднее линейное отклонение (средний модуль отклонения) в MS Excel рассчитывается с использованием функции СРОТКЛ().
Количество выборки - размер выборки используемой в данной процедуре. Количество выборки в MS Excel рассчитывается с использованием функции СЧЕТ().
Для проверки выборки на соответствие генеральной совокупностирассчитываются следующие показатели:
Коэффициент вариации используется и как показатель однородности выборочных наблюдений, определяется как отношение среднеквадратического отклонения к среднему значению. Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического:
Коэффициент вариации является относительной мерой рассеяния признака.
Коэффициент вариации используется и как показатель однородности выборочных наблюдений. Считается, что если коэффициент вариации не превышает 10 %, то выборку можно считать однородной, т. е. полученной из одной генеральной совокупности. Чем больше значение коэффициента вариации, тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений (выбросов).
Коэффициент вариации в MS Excel рассчитывается с использованием функций
СТАНДОТКЛОН() / СРЗНАЧ().