Точность наблюдения и методы проверки достоверности данных
Каждое конкретное измерение величины данных, осуществляемое в процессе наблюдения, дает, как правило, приближенное значение величины явления, в той или иной мере отличающееся от истинного значения этой величины. Степень соответствия действительной величине какого-либо показателя или признака, полученного по материалам наблюдения, называется точностью статистического наблюдения. Расхождение между результатом наблюдения и истинным значением величины наблюдаемого явления называется ошибкой наблюдения.
По своему характеру ошибки делятся на случайные и систематические.
Случайныминазывают ошибки, возникновение которых обусловлено действием случайных факторов. К ним относятся оговорки и описки опрашиваемого лица. Они могут быть направлены в сторону уменьшения или увеличения значения признака, на конечном результате они, как правило, не отражаются, так как взаимопогашаются при сводной обработке результатов наблюдения.
Систематические ошибки имеют одинаковую тенденцию либо к уменьшению, либо к увеличению значения показателя признака. Это связано с тем, что измерения, например, производятся неисправным измерительным прибором или ошибки являются следствием неточной формулировки вопроса программы наблюдения и др. Систематические ошибки представляют большую опасность, так как в значительной мере искажают результаты наблюдения.
В зависимости от стадии возникновения различают ошибки регистрации; ошибки, возникающие в ходе подготовки данных к машинной обработке; ошибки, проявляющиеся в процессе обработки на вычислительной технике.
К ошибкам регистрацииотносятся те неточности, которые возникают при записи данных в статистический формуляр (первичный документ, бланк, отчет, переписной лист) или при вводе данных в вычислительную технику, искажение данных при передаче через линии связи (телефон, электронную почту). Часто ошибки регистрации возникают из-за несоблюдения формы бланка, т. е. запись произведена не в ту строку или графу документа. Случается и преднамеренное искажение значений отдельных показателей.
Ошибки при подготовке данных к машинной обработке или в процессе самой обработкивозникают в вычислительных центрах или центрах подготовки данных. Возникновение таких ошибок связано с небрежным, неправильным, нечетким заполнением данных в формулярах, с физическим дефектом носителя данных, с потерей части данных из-за несоблюдения технологии хранения информационных баз либо определяются сбоями в работе оборудования.
Зная виды и причины возникновения ошибок наблюдения, можно в значительной мере снизить процент подобных искажений информации.
Различают следующие виды ошибок:
ошибки измерения, связанные с определенными погрешностями, которые возникают при однократном статистическом наблюдении явления и процессов общественной жизни;
ошибки репрезентативности, возникающие в ходе несплошного наблюдения и связанные с тем, что сама выборка не репрезентативна, и результаты, полученные на ее основе, не могут распространяться на всю совокупность;
преднамеренные ошибки, возникающие из-за сознательного искажения данных с разными целями, среди которых желание приукрасить действительное состояние объекта наблюдения или, наоборот, показать неудовлетворительное состояние объекта (данное искажение информации является нарушением закона);
непреднамеренные ошибки, как правило, носящие случайный характер и связанные с низкой квалификацией работников, их невнимательностью или небрежностью. Часто такие ошибки связаны с субъективными факторами, когда люди дают неправильную информацию о своем возрасте, семейном положении, образовании, принадлежности к социальной группе и т. д. или просто забывают некоторые факты, сообщая регистратору информацию, которая только что возникла в памяти.