Ошибки статистического наблюдения. методы контроля данных наблюдения
Прежде всего проверяется полнота охвата единиц наблюдением. С этой целью производится сверка данных, пересчитываются заполненные анкеты.
При проведении массовых социологических обследований часто кроме основного списка составляется дополнительный список респондентов на тот случай, если респонденты из основного списка почему-либо не могли быть опрошены. Дополнительный список формируется так, чтобы при замене респондентов общая структура опрашиваемых сохранялась. Поэтому при проверке устанавливается соответствие фактически опрошенных основному и дополнительному спискам. Проверка полноты охвата единиц не означает применения только сплошного наблюдения. Она связана с выявлением недоучета или повторного счета и обеспечения проектируемых пропорций собранных данных.
Одновременно на этой стадии проверяется полнота заполнения каждого формуляра наблюдения - формы отчетности, анкеты и т. д.
После такой общей проверки проводится детальная проверка каждого полностью заполненного формуляра.
Чтобы хорошо организовать проверку, нужно представлять характер возможных ошибок. Все ошибки наблюдения можно назвать ошибками регистрации. Но они имеют разный характер и по-разному сказываются на результатах статистического исследования. Ошибки могут быть случайными и систематическими. Те и другие чаще всего возникают при опросе, но могут быть допущены и при непосредственном или документальном наблюдении.
Во всех случаях источниками ошибок может быть как информация, поступившая от объекта наблюдения (ошибки в ответах опрашиваемого, искажения в показаниях приборов, регистрирующих какие-либо свойства объекта, ошибки в учетных документах), так и ошибки регистратора или экономиста предприятия, представляющего данные (неправильная запись ответов опрашиваемого, ошибки при переносе на формуляры наблюдения показателей приборов, данных учетных документов).
Случайные ошибки не имеют какой-либо направленности. Это описки, оговорки, перестановки цифр при записи цифровых данных и т.д. При обобщении массового материала они взаимопогашаются и не могут исказить значения сводных показателей и результаты анализа.
Другое дело систематические ошибки - они являются неслучайными и имеют определенную направленность. Такие ошибки очень опасны, так как приводят к искажению результатов статистического исследования. Эти ошибки, как правило, являются преднамеренными. Известно, например, что люди предпочитают преуменьшать свои доходы, округлять возраст, стараются показать большую осведомленность в области культуры, науки, чем это есть на самом деле. Предприятия также могут внести элементы недостоверности в свою информацию, особенно в те характеристики, от которых зависят величина налоговых платежей, расчеты с кредиторами и т. п. Все ошибки такого рода необходимо выявить и исправить. Поэтому после проверки полноты данных проводится их контроль - счетный и логический.
Счетный контроль основан на жесткой связи между признаками, которая может быть проверена арифметическими действиями: сложением, вычитанием, умножением, делением. Связь такого рода часто отражается в заголовках граф отчетности и в подсказах такого рода: графа Х равна графе Y плюс графа Z или графа Х равна графе Y, деленной на графу Z, и т.д. Счетный контроль используется для проверки итоговых сумм. Если представленное число слагаемых не является полным, то сумма слагаемых должна быть меньше либо равна общему итогу, но не может превышать его.
Счетный контроль совершенно определенно устанавливает наличие ошибки, тогда как логический контроль может лишь поставить под сомнение правильность данных. Логический контроль основан на логической взаимосвязи между признаками. Классическим примером является пример взаимосвязи данных при переписи населения: вопросы о возрасте, образовании, семейном положении взаимоконтролируются. Если, например, окажется, что гражданин десяти лет женат или пятилетний имеет общее среднее образование, то ясно, что при заполнении формуляра допущены ошибки либо при записи возраста, либо другой характеристики.
Логический контроль основан и на сравнении с данными прошлого периода. Например, достоверность данных о выпуске продукции по видам может быть проведена сравнением с данными прошлого периода для того же предприятия. Кроме того, логический контроль опирается на представления о пределах возможных значений признака: минимуме и максимуме.
Обычно для проверки поступающего материала наблюдения составляется схема контроля, в которую включаются все увязки между вопросами программы наблюдения: как арифметические, так и логические.
Никогда не следует произвольно вносить исправления в формуляр. Необходимо либо самому статистику провести повторное наблюдение (повторный опрос и т. д.), либо обратиться к лицам, отвечающим за представленную информацию (директору, главному бухгалтеру предприятия).
Данные наблюдения считаются принятыми, если они прошли контроль и если потребовалось, в них внесены Исправления. Проверкой собранных данных завершается начальный этап статистического исследования.