Математическая обработка экспериментальных данных

Математические методы представляют совокуп­ность алгоритмов, основанных на теоретических поло­жениях и идеях определенного раздела математики и позволяющих осуществить комплексный анализ тех или иных закономерностей и отношений. Применение математических методов в инженерной психологии развивается, как уже отмечалось, по трем основным направлениям:

■ математическая обработка экспериментальных данных;

■ математическое моделирование деятельности оператора;

■ вычисление количественных значений инженерно-пси­хологических показателей.

Во многих случаях основным способом вычисле­ния последних является обработка экспериментальных данных или моделирование, поэтому это направление в данном разделе специально не рассматривается. Способы вычисления этих показателей рассматрива­ются при изучении соответствующих вопросов. При­менение математических методов связано с прогрес­сом вычислительной техники, применением ЭВМ в инженерно-психологических исследованиях. Эта связь наиболее ярко проявляется при автоматизации обра­ботки результатов эксперимента, применении имита­ционных моделей деятельности оператора, производ­стве различного рода вычислений.

Основными задачами математической обработки экспериментальных данных являются: определение характеристик случайных величин и событий, сравне­ние между собой их вычисленных значений, построе­ние законов распределения случайных величин, уста­новление зависимости между полученными случайными величинами, анализ случайных процессов. Эти вопро­сы подробно излагаются в специальной литературе [112, 128, 177]. Здесь же представляется целесообразным рас­смотреть лишь особенности и возможности применения их при решении инженерно-психологических задач.

Основными характеристиками случайных величин являются их математическое ожидание и дисперсия, а случайных событий — вероятность их наступления. Математическое ожидание характеризует среднее зна­чение наблюдаемой случайной величины (например, времени реакции, погрешности измерений, числа оши­бок, допущенных человеком при выполнении работы и т. п.), а дисперсия является мерой рассеивания ее зна­чений относительно среднего значения. Выборочные (опытные) значения математического ожидания и дис­персии вычисляются соответственно по формулам

Математическая обработка экспериментальных данных - student2.ru (8.1)

где хi — наблюденное значение случайной величины,

n — объем выборки (число наблюдений).

Квадратный корень из дисперсии, т. е. величина, Математическая обработка экспериментальных данных - student2.ru , носит название среднеквадратического отклонения и имеет ту же размерность, что и сама случайная величина. Для оценки вероятности случайного события используют величину Математическая обработка экспериментальных данных - student2.ru , где m — число опытов, в которых данное событие имело место. Чем больше n, тем ближе вычисленные значения Математическая обработка экспериментальных данных - student2.ru , Dx, P к своим истинным значениям, характеризующим генеральную совокупность изучаемой случайной величины.

Сравнение между собой одноименных характери­стик нескольких выборок проводится потому, что в силу ограниченного объема выборки полученные различия между характеристиками случайных величин (матема­тическими ожиданиями, дисперсиями и др.) может быть случайным и не всегда означает, что эти величины различны на самом деле. Проверку этого факта, т. е. проверку статистических гипотез, нужно проводить с помощью непараметрических и параметрических кри­териев согласия.

В первом случае используются не сами значения наблюдаемых величин, а только их упорядоченность (для каждой пары сравниваемых величин известно, какая из них больше), т. е. критерии, не зависящие от параметров распределения. Такие критерии весьма удобны для практического использования, так как тре­буют минимального объема вычислений и априорных сведений и могут использоваться даже при невозмож­ности прямых измерений изучаемых признаков. Такие случаи встречаются, например, при проверке степени различия индивидуальных качеств двух групп опера­торов в случае, если эти качества не могут быть коли­чественно определены. Основными из непараметри­ческих критериев согласия являются критерий знаков, критерий Смирнова и критерий Вилконсона.

При использовании параметрических критериев вычисляются значения параметров сравниваемых рас­пределений. Это усложняет процедуру сравнения, од­нако позволяет получить более точные результаты. Основными из параметрических критериев являются критерий Фишера, критерий Стьюдента и критерий x2. Критерий Фишера используется для проверки стати­стических гипотез о равенстве дисперсий двух выбо­рок. Он применяется в тех прикладных задачах, где необходимо исследовать стабильность изучаемых ве­личин. Например, он может быть использован для сравнения рассеяний ошибок двух операторов, разбро­сов оценок экспертов, полученных по разным методи­кам, однородности латентных периодов времени реак­ции в различных экспериментах и т. п. Критерий Стьюдента применяется для проверки значимости различия между двумя средними значениями, крите­рий x2 служит для сравнения двух распределений, для проверки согласия эмпирического распределения с одним из теоретических.

Одним из способов проверки статистических ги­потез является последовательный анализ. Он приме­няется в том случае, когда число наблюдений в ис­следовании не устанавливается заранее, а является случайной величиной. Особенность последовательно­го анализа состоит в том, что после осуществления каж­дого наблюдения принимается одно из следующих решений: принять проверяемую гипотезу, отвергнуть ее, продолжать испытания. Прикладные задачи иссле­дования, в которых применяется последовательный анализ, могут быть теми же, что и в случае проверки гипотез по выборкам заданной длины, но при этом возможна существенная экономия в длительности эк­сперимента. В инженерной психологии последователь­ный анализ широко используется, например, при оцен­ке результатов деятельности оператора. С его помощью определяется то число опытов (решаемых оператором учебных задач), по выполнении которых оператору с заданной достоверностью выставляется оценка «зачет» или «незачет».

Процедура последовательного анализа сводится к следующему. На каждом шаге испытаний после каж­дого опыта фиксируется число dn благоприятных исхо­дов среди проведенных п наблюдений. По известным формулам [15], зная заданные вероятности ошибок первого и второго рода, определяются значения оце­ночных границ аn и rn. В системе координат (dn, n) стро­ятся две параллельные прямые гп (п) и ап (п), имеющие одинаковый угловой коэффициент (рис. 8.1). Точки (dn, n) наносятся на график по ходу контроля, и эксперимент проводится до тех пор, пока очередная точка не вый­дет за пределы полосы, заключенной между прямыми ап и гп. Если dn<an, то оператор получает «незачет», если

Математическая обработка экспериментальных данных - student2.ru

Рис. 8.1. Схема проведения последовательного анализа

dn>rn— «зачет». В случае, если an<dn<rn, то проверка продолжается. Применение последовательного анали­за позволяет существенно уменьшить объем исследо­вания по сравнению с традиционным методом фикси­рованной однократной выборки.

Построение законов распределения позволяет наи­более полно и точно описать изучаемую случайную величину, полученную в результате проведения инже­нерно-психологического наблюдения или эксперимен­та. Для построения закона распределения предвари­тельно строится гистограмма (от греч. histos — столб и gramma— запись). Она является одним из способов графического представления количественных данных в виде прямоугольных столбиков, примыкающих друг к другу, высота которых соответствует частоте каждо­го класса данных. Для построения гистограммы интер­вал, в котором сосредоточены наблюдения, делится на n подынтервалов (разрядов) и подсчитывается число наблюдений, значения которых соответствует данному разряду. На основании этих данных и строится гистог­рамма, которая представляет собой кусочно-непрерыв­ную функцию, которая в пределах данного разряда равна числу (частоте) наблюдений, попавших в него. Наиболее часто гистограмму практически применяют в качестве плотности распределения случайной вели­чины, по наблюдениям которой она построена.

Различают одномерные и многомерные (в частно­сти, двумерные) законы распределения. Одномерный закон показывает, как часто в изучаемой совокупности встречаются опыты с данным значением изучаемой случайной величины. Закон распределения можно изобразить графически (рис. 8.2), либо описать той или иной аналитической зависимостью. Его пик приходит­ся на наиболее вероятное (наиболее распространенное) значение случайной величины. Примерами такого за­кона являются, в частности, распределения значений тех или иных антропометрических показателей. Дву­мерный закон учитывает совместное распределение двух количественных показателей, например, числа ошибок и времени решения задач оператором [35]. В инженерной психологии наиболее часто применяет­ся нормальный, экспоненциальный, биноминальный законы распределения, альфа- и гамма- распределения, распределение Пуассона и др. Соответствие меж­ду опытным

Математическая обработка экспериментальных данных - student2.ru

Рис. 8.2. Гистограмма и сглаживающая ее теоретическая функция распределения (пример).

и теоретическим распределениями прове­ряется с помощью критериев согласия x2 или Колмо­горова. При этом следует иметь в виду, что одно и то же опытное распределение может дать положительный результат при сравнении не с одним, а с несколькими теоретическими распределениями. Такое обстоятель­ство имеет место, например, при изучении времени реакции оператора [182]. В таких случаях следует опи­раться не только на результаты формальной проверки с помощью критериев согласия, а изучать прежде все­го психологическую сущность и условия применимос­ти того или иного закона распределения.

Для определения связи между двумя и более пере­менными используются такие методы статистического анализа, как корреляционный, регрессионный, диспер­сионный, факторный и др. Корреляционный анализ служит для установления вида, знака и тесноты связи между двумя или несколькими случайными переменны­ми. В первом случае используют коэффициент парной корреляции, во втором — коэффициент множественной корреляции. Примером использования корреляционно­го анализа в инженерной психологии является, в част­ности, проверка прогностической валидности психоди- агностических тестов. Мерой валидности является в этом случае коэффициент корреляции оценок испы­туемых по психофизиологическим методикам с оцен­ками их профессиональной деятельности (т. е. с вне­шним критерием). Однако всегда следует помнить, что при интерпретации результатов корреляционного анализа необходима особая осторожность при учете статистически достоверных высоких корреляций: иногда могут возникнуть ложные корреляции за счет того, что обе изучаемые переменные испытывают сильное влияние третьего, не учтенного при наблю­дении фактора.

Для более углубленного изучения сопряженности количественных показателей в исследуемой совокуп­ности объектов служит регрессионный анализ. Регрес­сия (от лат. regressio — движение назад), выражаемая либо графически, либо аналитически, показывает как в среднем изменяется изучаемый показатель при из­менениях какого-то фактора (факториального показа­теля). Так же как и корреляция, регрессия может быть парной, либо множественной. В общем случае проце­дура регрессивного анализа (на примере парной рег­рессии) сводится к следующему. Пусть есть основания полагать, что изучаемые случайные величины х и у связаны некоторым соотношением. Тогда задача его описания распадается на установление общего вида зависимости и вычисление оценок его параметров. Стандартных методов выбора общего вида кривой не существует: здесь необходимо сочетать визуальный анализ корреляционного поля с качественным анали­зом природы переменных. Методы оценки параметров наиболее хорошо разработаны для линейных зависи­мостей, основным из них является метод наименьших квадратов. В общем виде уравнение множественной линейной регрессии имеет вид

Математическая обработка экспериментальных данных - student2.ru (8.2)

где а0 и аi — неизвестные коэффициенты, определяе­мые методом наименьших квадратов; xi — исследуемые психологические показатели; n — число учитываемых показателей.

При п = 1 выражение (8.2) превращается в уравне­ние парной регрессии. Выражения типа (8.2) называ­ются также регрессионными моделями. В заключение отметим, что регрессия показывает лишь как изменя­ется изучаемый показатель в зависимости от измене­ния факторных показателей, но она ни в коем случае не показывает причинно-следственных связей между показателями.

При изучении трудовой деятельности часто при­ходится оценивать достоверность и степень влияния какого-либо фактора (или факторов) на изменение ве­личины некоторого показателя деятельности человека по сравнению со случайными причинами (например, случайным изменением значений изучаемого показа­теля от опыта к опыту). Эффективным методом реше­ния подобных задач является дисперсионный анализ. В зависимости от числа факторов, влияние которых исследуется, дисперсионный анализ подразделяется на одно-, двух-, трех- и т. д. факторный. При проведении дисперсионного анализа вся совокупность эксперимен­тальных данных разбивается на группы по градациям факторов. Градации могут различаться либо качествен­но, либо количественно по степени действия фактора. Так, при изучении влияния космического полета на психофизиологические показатели космонавта в дис­персионный комплекс были включены такие факторы, как условия работы космонавта с двумя градациями (полетные условия, земные условия); индивидуальность космонавта, каждую градацию которой представлял конкретный человек [137]. Значимость влияния факто­ра оценивается с помощью критерия согласия Фише­ра, представляющего в данном случае отношение факториальной (межгрупповой) дисперсии к случайной (внутригрупповой). Если различие между этими дис­персиями оказывается значимым, то и действие фак­тора на исследуемый показатель деятельности челове­ка оказывает существенное влияние.

Для исследования статистически связанных при­знаков с целью установления определенного числа скрытых от наблюдения факторов используют фактор­ный анализ. С его помощью устанавливается связь изменения одной переменной (например, показателя деятельности оператора) с изменением другой переменной и определяются основные факторы, лежащие в основе указанных изменений. Несколько реже по сравнению с рассмотренными при математической обработке данных в инженерной психологии исполь­зуются латентный и кластерный анализы.

Многие из изучаемых в инженерной психологии процессов носят вероятностный характер и поэтому описываются случайными функциями. Примером их является большинство электрофизиологических пока­зателей, рассмотренных в главе VII: ЭЭГ, ЭКГ, ЭМГ, ЭОГ и др. Математическая обработка эксперименталь­ных данных заключается в этом случае в вычислении основных характеристик данной случайной функции по ее отдельным реализациям, зарегистрированным в ходе эксперимента. Важной задачей при этом является установление таких свойств случайного процесса, как стационарность (постоянство основных характеристик во времени) и эргодичность (совпадение математичес­ких ожиданий и других характеристик для всех имею­щихся реализаций данной случайной функции). Для анализа стационарных процессов применяется спект­ральный анализ. Свойство эргодичности позволяет выявить все характеристики данной случайной функ­ции по одной достаточно длинной реализации, в то время как характеристики не эргодических процессов возможно определить лишь при достаточно большом числе реализаций.

В инженерной психологии, как правило, экспери­ментальному изучению подвергается не вся генераль­ная совокупность, а только часть ее — выборка; т. е. группа испытуемых, представляющих определенную популяцию и отобранных для эксперимента или на­блюдения. На основании полученных характеристик выборки делаются выводы о генеральной совокупно­сти. Практически любое статистическое исследование в инженерной психологии основано на анализе свойств и характеристик определенной выборки. Ее объем определяется двумя противоречивыми услови­ями. С одной стороны, она должна быть достаточно большой, чтобы правильно отразить все свойства ге­неральной совокупности. С другой стороны, она не должна быть чрезмерно большой, чтобы была реаль­ная возможность ее изучения. Поэтому результаты математической обработки экспериментальных дан­ных для выборки (вследствие случайного отбора в нее объектов из генеральной совокупности) могут отли­чаться от соответствующих характеристик генераль­ной совокупности. В связи с этим необходимо оценить достоверность полученных результатов, т. е. возмож­ность их распределения на всю генеральную совокуп­ность.

Для оценки достоверности пользуются принципом практической уверенности. Он состоит в том, что до­стоверным считают событие, имеющее достаточно большую, близкую к единице, вероятность. Такая ве­роятность называется доверительной. Величина, до­полняющая ее до единицы, называется уровнем зна­чимости. Он представляет собой вероятность того, что заключение, принятое достоверным, на самом деле окажется ошибочным. Общепринятыми считаются три уровня значимости: 0,05 —- для обычных исследо­ваний, 0,01 — для важных исследований, 0,001 — для особо важных исследований (например, связанных с отсутствием вредности какого-либо воздействия на человека). Соответствующие этим уровням значимо­сти доверительные вероятности соответственно рав­ны: 0,95; 0,99; 0,999. При построении законов распре­деления случайных величин вычисляется также для заданной доверительной вероятности диапазон воз­можных значений генеральной статистической ха­рактеристики. Этот диапазон называется доверитель­ным интервалом.

При отборе данных, характеризующих ту или иную выборку в инженерно-психологических исследованиях, следует учитывать в ряде случаев различные проявле­ния изменчивости характеристик оператора. Существу­ет по крайней мере два ее проявления. Во-первых, от индивидуума к индивидууму (индивидуальные разли­чия между операторами); во-вторых, для конкретного индивидуума — случайное изменение характеристик оператора от опыта к опыту. Одновременный учет обоих проявлений изменчивости может проводиться различными способами:

■ при формировании выборки для каждого из п испыту­емых берется по некоторому числу m реализаций слу­чайной величины, всего получается N = m-n значений;

■ с помощью жребия выбирается конкретный оператор и для него берется требуемое число значений изучаемой случайной величины;

■ выборка формируется по всем п операторам из сред­них значений изучаемой случайной величины, получен­ных на основании усреднения m значений этой величи­ны для каждого оператора, что эквивалентно, как и в первом случае, общему объему выборки, равному N=mn.

Однако в любом случае выборка обязательно дол­жна быть представительной, т. е. такой, чтобы элемент генеральной совокупности мог попасть в нее с задан­ной вероятностью, не зависящей от характеристик, подлежащих измерению. Такая выборка называется репрезентативной (от фр. representatif — представи­тельный).


Наши рекомендации