А.Д. Гулидов, А.Л. Кевеш, М.Н. Сидоров, В.М. Симчера 6 страница
К числу проблем следует отнести и тот факт, что государственные пользователи недостаточно четко представляют себе, что такое принцип конфиденциальности в статистике и почему его следует соблюдать. У нас в стране много органов власти (более 20), которым в соответствии с законодательством Российской Федерации предоставлено право требовать представления статистической информации. Поэтому Госкомстат России и его территориальные органы вынуждены предоставлять им индивидуальные и конфиденциальные данные в разрезе предприятий как служебную информацию ограниченного распространения.
Существует и ряд других проблем, в том числе касающихся и юридической базы статистических данных, и применения принципа конфиденциальности, решение которых в огромной мере зависит от законодательного закрепления принципа конфиденциальности в деятельности органов государственной статистики.
Основными целями введения конфиденциальности статистических данных являются:
- защита права на неприкосновенность частной жизни как физических, так и юридических лиц и выработка доверия к органам государственной статистики и уверенности в том, что их индивидуальные данные будут использованы только в целях статистики, т.е. для производства официальной (сводной) статистической информации, и никакие их индивидуальные данные, содержащиеся в государственной статистической отчетности, не будут в принципе разглашаться;
- стремление способствовать повышению уровня национальной безопасности во всех ее формах: безопасности общества, государства, личности, а также различных сфер жизнедеятельности – военно-промышленной, промышленной, инвестиционной, транспортной, финансовой, научно-технической, экологической, социальной и др.
Определение уровня и степени конфиденциальной информации в большей мере зависит от уровня агрегирования информации и должно соответствовать международным требованиям, практике и правилам, а также обеспечению национальной безопасности.
Структура конфиденциальной информации должна отвечать иерархической структуре формирования отчетной статистической информации. Следовательно, необходимо согласовывать состав конфиденциальной информации между различными информационными уровнями. В частности, необходимо обеспечить защиту от возможности получения конфиденциального показателя, относящегося к более высокому уровню агрегирования, путем суммирования значений соответствующих показателей агрегатов более низкого уровня, даже если эти показатели сами по себе не являются конфиденциальными. Кроме того, необходимо проводить анализ методик формирования вторичных (обобщенных) показателей, например, в задачах диагностики безопасности на основе первичных показателей.
Если вторичные показатели следует отнести к конфиденциальным, то требуется также выяснить, каким из первичных показателей целесообразно присвоить гриф конфиденциальности, чтобы затруднить расчет конфиденциального вторичного показателя на основе первичных неконфиденциальных.
Очевидно, что состав конфиденциальных показателей на более низких ступенях иерархии существенно расширяется по сравнению с более обобщенной, а следовательно и в большей степени обезличенной информацией на более высоком уровне агрегирования.
Несмотря на отсутствие в Российской Федерации Закона об официальном статистическом учёте, Госкомстатом России в последние годы принят ряд мер по обеспечению конфиденциальности статистических данных.
Госкомстат России в соответствии с Федеральным законом от 20 февраля 1995 г. № 24-ФЗ «Об информации, информатизации и защите информации» (статьи 10, 12), Гражданским кодексом Российской Федерации (статья 139), Указом Президента Российской Федерации от 6 марта 1997 г. № 188, Положением о Государственном комитете Российской Федерации по статистике (пункты 9.12 и 9.13), а также руководствуясь Основополагающими принципами официальной статистики, одобренными Статистической комиссией ООН в 1994 г. (см. прил. 4), гарантирует отчитывающимся субъектам конфиденциальность полученных от них индивидуальных данных по показателям, содержащимся в формах государственного статистического наблюдения, и использует эти данные только для формирования сводной (агрегированной) официальной статистической информации в целом по стране, отдельным регионам, отраслям и секторам экономики и социальной сферы. Соответствующая запись сделана на бланках форм государственного статистического наблюдения, утверждаемых нормативными правовыми актами Госкомстата России.
В связи с возросшим давлением на органы государственной статистики со стороны отдельных федеральных органов государственной власти, органов государственной власти субъектов Российской Федерации и органов местного самоуправления с целью получения доступа к статистическим данным, содержащимся в государственной статистической отчётности предприятий и организаций, т.е. к микроданным (данным, относящимся к отдельной статистической единице), Госкомстатом России в 2001 и 2002 гг. проведён специальный опрос крупных и средних предприятий с целью выяснения их отношения к возможности передачи их индивидуальных данных, собираемых в ходе регулярных статистических обследований, заинтересованным пользователям и их официального опубликования. В среднем около 22% опрошенных предприятий дали однозначно положительный ответ.
Приказом Госкомстата России от 7 апреля 2001 г. № 67 введен в действие Порядок работы со служебной информацией в центральном аппарате Госкомстата России и его территориальных органах, которым определены правила работы со служебной информацией и меры ответственности государственных служащих за ее разглашение и использование в неслужебных целях.
Кроме того, Госкомстат России отнёс индивидуальные данные, содержащиеся в формах государственного статистического наблюдения, с момента их получения органами и организациями государственной статистики к служебной информации ограниченного распространения (служебной тайне), доступ к которой ограничен Госкомстатом России в соответствии со статьей 139 Гражданского кодекса Российской Федерации, и установил, что предоставление статистических данных, содержащихся в государственной статистической отчётности, территориальными органами и организациями государственной статистики третьим лицам не допускается без письменного согласия представивших эти данные юридических лиц и других хозяйствующих субъектов, в связи с обязательствами, взятыми Госкомстатом России, по обеспечению их конфиденциальности.
Вместе с тем, отдельные органы государственной власти имеют право в соответствии с законодательством Российской Федерации, регулирующим их деятельность (федеральными конституционными законами, федеральными законами, указами Президента Российской Федерации, постановлениями Правительства Российской Федерации), запрашивать сведения конфиденциального характера.
При поступлении в Госкомстат России от указанных органов государственной власти письменных мотивированных запросов, оформленных на соответствующих бланках и подписанных уполномоченными на то должностными лицами, о предоставлении статистических данных, содержащихся в государственной статистической отчётности, эти запросы направляются в Отдел по защите государственной тайны Госкомстата России для рассмотрения его правомерности.
Предоставление запрашиваемых индивидуальных данных осуществляется только после получения письменного разрешения Отдела по защите государственной тайны Госкомстата России с пометкой «Для служебного пользования».
Госкомстатом России анализируются запросы органов государственной власти и организаций о предоставлении информации в разрезе отчитывающихся субъектов и готовятся рекомендации о предоставлении статистических данных.
Постановлением Госкомстата России от 15 июля 2002 г. № 154 утверждено «Положение о порядке предоставления статистической информации, необходимой для проведения государственных статистических наблюдений». Указанное постановление зарегистрировано в Минюсте России. Третий раздел указанного Положения посвящен конфиденциальности статистических данных. Госкомстат России гарантирует отчитывающимся субъектам конфиденциальность полученной от них статистической информации по формам государственного статистического наблюдения (первичных статистических данных) и предусматривает соответствующую запись об обеспечении гарантии на бланках форм.
Предоставление статистической информации, содержащейся в формах государственного статистического наблюдения (первичных статистических данных), кроме отнесенной к государственной тайне, Госкомстатом России, его территориальными органами и находящимися в его ведении организациями осуществляется третьим лицам при наличии письменного согласия представивших эти данные отчитывающихся субъектов, за исключением случаев, предусмотренных законодательством.
В федеральной системе государственной статистики повышенное внимание уделяется обеспечению конфиденциальности данных физических лиц (персональных данных), в том числе при проведении переписей населения.
Конституция Российской Федерации провозгласила право каждого на неприкосновенность частной жизни, личную и семейную тайну. Сбор, хранение и распространение информации о частной жизни лица без его согласия не допускаются.
Эти нормы получили своё развитие в Федеральном законе от 20 февраля 1995 г. № 24-ФЗ «Об информации, информатизации и защите информации». Статья 11 этого закона установила, что информация о гражданах (персональные данные) относится к категории конфиденциальной информации. К персональным данным относятся сведения о фактах, событиях и обстоятельствах жизни гражданина, позволяющие идентифицировать его личность.
Госкомстат России руководствуется указанными юридическими нормами при осуществлении статистического наблюдения за социально-демографическими процессами, когда респондентами статистики являются физические лица.
В соответствии с Федеральным законом от 25 января 2002 г. № 8-ФЗ «О Всероссийской переписи населения» сведения о населении, содержащиеся в переписных листах, являются конфиденциальной информацией, не подлежат разглашению (распространению) и используются в целях формирования соответствующих федеральных информационных ресурсов.
Во исполнение требований указанного Закона Госкомстатом России разработаны и реализуются организационно-технические правила обработки конфиденциальной информации Всероссийской переписи населения 2002 г. Обработка сведений о населении, содержащихся в переписных листах, осуществляется в условиях, обеспечивающих их защиту от несанкционированного доступа и предотвращение их хищения, утраты, подделки или иного искажения.
При подведении итогов переписи населения осуществляется обезличивание используемых данных путём представления их в обобщённой форме. При этом для обобщённых данных режим конфиденциальности, установленный для сведений о населении, содержащихся в переписных листах, снимается. Совокупность этих мер даёт необходимый эффект и обеспечивает конфиденциальность микроданных, содержащихся в переписных листах.
Итоги Всероссийской переписи населения являются доступными каждому и подлежат официальному опубликованию.
Сбор огромного количества информации в ходе переписи неизбежно вызывает озабоченность общественности вопросами конфиденциальности. Одной из областей, где требуются особые меры по защите данных, является передача информации по компьютерным сетям. С целью реализации Федерального закона «Об информации, информатизации и защите информации» и Доктрины информационной безопасности, создается система защиты информационных ресурсов ЛВС центрального аппарата Госкомстата России от несанкционированного доступа и разработаны проектно-технологические решения по защите от несанкционированного доступа информационных ресурсов ГМЦ Госкомстата России и территориальных органов государственной статистики.
Развитие ИВС Госкомстата России, затрагивающее все области информационных технологий – от топологий локальных вычислительных сетей до специализированных статистических прикладных систем, требует повышенного внимания к обеспечению информационной безопасности конфиденциальных данных.
Для обозначения приоритетов развития системы информационной безопасности предусматривается:
определение потоков информации ограниченного распространения (с разделением по классам информации);
создание модели вероятного нарушителя и модели утрат информационной безопасности Госкомстата России (на основе анализа потоков информации);
определение политики безопасности Госкомстата России и стратегии ее реализации, которая будет содержать технические описания применяемых технологий обеспечения информационной безопасности.
Обеспечение защиты информации с ограниченным доступом должно быть реализовано путем создания системы комплексной защиты информации, реализующей различные уровни криптографической защиты. При этом должна быть предусмотрена возможность поэтапного наращивания возможностей по защите информации на всех уровнях объектов ИВС. Требования обеспечения конфиденциальности и защиты от несанкционированного доступа будут реализованы, в частности, путем использования сертифицированных средств шифрования и электронно-цифровой подписи (ЭЦП) для обеспечения подтверждения авторства и неизменяемости предоставленных данных.
2.3.4. Качество официальной статистической
информации
В современных условиях значение качества представления пользователям информации возросло значительно. Это обусловливается, во-первых, усложнением экономики как целостного организма, в котором «цена» ошибки при принятии хозяйственных решений или при сборе необходимых для их обоснования данных становится все выше: последствия ошибки оказывают влияние на возрастающее число звеньев в сфере производства и обращения. Во-вторых, широкое применение экономико-математических методов и электронно-вычислительной техники, развитие интегрированных систем обработки данных, повышение комплексности их использования для решения различных задач предъявляют более высокие требования к качеству информации. Ошибка в исходных данных накапливается в последующих многократных вычислениях и может обесценить результаты сложных дорогостоящих расчетов. В третьих, проблемы качества данных заслуживают внимания потому, что проверка достоверности с ростом объемов обрабатываемых данных становится все более трудоемкой.
Одной из главных задач для эффективного управления в социально-экономической сфере является достижение приемлемого уровня качества представляемой пользователям статистической информации, что достигается путем регламентации гармонизированных с международной статистической практикой основных понятий и требований, предъявляемых к качеству данных в системе государственной статистики.
В мировой статистической практике нет общепринятого определения качества данных как результата статистической деятельности. Тем не менее, в настоящее время установилось и превалирует понятие качества, основанное на оценке степени нужности статистических данных пользователям. Двумя другими компонентами современного понятия качества являются корректность применяемой статистической методологии (в том числе соответствие принятым международным стандартам, таким как СНС) и ее соблюдение органами статистики в процессе сбора, обработки, анализа и публикации данных.
Соответствующие аспекты качества могут быть выражены в терминах целостности, востребованности, точности и достоверности, своевременности, доступности, интерпретируемости и сопоставимости. Эти элементы качества должны учитываться и быть сбалансированными при планировании статистических программ.
Целостность заключается в том, что статистическая деятельность должна основываться на научно обоснованной методологии и неукоснительном соблюдении утвержденных методик проведения обследований при сборе, обработке и распространении статистических данных. Этот термин охватывает институциональные основы, устанавливающие принцип объективности статистической деятельности и этические нормы, призванные гарантировать профессионализм при осуществлении планирования и проведении наблюдений, в том числе прозрачность используемой методологической базы.
Методологическая база статистической деятельности должна быть гармонизирована с принятыми международными стандартами и принципами ее использования в статистической практике.
Востребованность статистических данных представляет собой качественную оценку степени их нужности пользователям, т.е. насколько данные служат целям, ради которых были произведены, и доведены ли они до пользователя. Востребованность характеризует корректность поставленных цели и задач статистического исследования, их соответствия нормативно-правовой базе. При планировании статистической деятельности с учетом удовлетворения запросов пользователей необходимо учитывать стоимость и затраты времени на формирование данных, соответствующих ожиданиям пользователей.
Достоверность – это степень адекватности результатов статистических наблюдений (отклонение оценок параметров используемых статистических моделей от их истинных значений), характеризующих социально-экономические и демократические явления. В практических терминах не существует единой и полной меры достоверности результатов статистических наблюдений, поэтому используются несколько форм ее выражения.
Исходя из практической потребности, достоверность обычно измеряется или описывается в терминах ошибок (потенциальных величин ошибок), вводимых через индивидуальные главные источники погрешности расчетов, такие как неполнота охвата реальной генеральной совокупности, ошибки, связанные с выборкой, случаями неответов респондентов, умышленным искажением представляемой информации, а также статистической обработкой данных.
Точность оценки статистического показателя характеризует случайную ошибку выборки и показывает величину отклонения рассчитываемого значения от ее усредненной величины по всем возможным выборкам.
Степень точности оценки обычно характеризуется ее дисперсией, стандартной ошибкой, коэффициентом вариации (относительной стандартной ошибкой) и доверительным интервалом. Точность какой-либо оценки, полученной по выборке, зависит от двух факторов: от способа, которым оценка вычисляется по данным выборки, и от способа формирования самой выборки.
Своевременность представления данных отражает приемлемую для пользователей продолжительность периода времени, проходящего от описываемого события до момента публикации соответствующих данных. Своевременность характеризуется предельно допустимым интервалом времени, на протяжении которого статистическая информация остается актуальной и востребованной пользователями.
Доступность отражает состояние готовности данных к официальному распространению (публикации), учитывая приемлемость формы (носителя), в которой данные становятся доступными пользователям, степень подготовленности соответствующих метаданных (информации о данных), а также информированность пользователей о возможности и средствах получения интересующих их данных. Одним из аспектов этой характеристики является возможность получения пользователями данных значительного объема.
Интерпретируемость статистических данных отражает возможность соотнесения пользователем статистических данных с объективной реальностью социально-экономической ситуации, а также простота их подготовки к анализу, в том числе автоматизированному. Строгость используемых в публикациях статистических терминов, включая определения признаков, показателей и границ исследуемых совокупностей в значительной мере определяют степень интерпретируемости.
Согласованность означает степень полноты данных и логической взаимосвязи между результатами статистического наблюдения и данными других наблюдений, либо показателями, полученными на их основе расчетным путем. Согласованные данные непротиворечивы в хронологической последовательности, сопоставимы и дополняют друг друга в сопряженных наблюдениях, относящихся к одному и тому же периоду времени. При этом необходимо учитывать, что используемые целевые совокупности могут отличаться в разных наблюдениях.
Достижение необходимого уровня качества результатов статистической деятельности требует от организаторов наблюдений тщательного планирования и осуществления непрерывного контроля за ходом их проведения.
Процесс проведения статистического наблюдения состоит из ряда последовательных этапов, данные которых обрабатываются раздельно. Перед организатором наблюдения стоит задача гарантировать качество результатов на каждой стадии.
Вместе с тем, каждый этап наблюдения необходимо рассматривать как часть единого процесса формирования сводных итогов.
При организации наблюдения необходимо учитывать потенциальные источники возникновения ошибок.
В планировании наблюдения принимают участие предметные специалисты, являющиеся методологами соответствующей отрасли статистики, а также специалисты в областях: организации статистического наблюдения, информационных технологий и публикации результатов.
Для достижения высокой эффективности использования ресурсного обеспечения от организатора требуется понимание значимости влияния каждого этапа процесса сбора и обработки данных на качество конечных результатов.
При организации наблюдения необходимо иметь достаточно полные сведения об основных источниках ошибок, их влиянии на уровень общей погрешности, о путях эффективного использования. Наличие таких сведений позволяет оценить альтернативные возможности распределения ресурсного обеспечения по этапам его наблюдения. Указанный подход особенно эффективен при проведении периодических наблюдений и приводит к последовательному повышению качества результатов на данном этапе.
При определении цели и задач наблюдения организаторы, как правило, исходят из максимального удовлетворения установленных потребностей пользователей в статистической информации, соответствующей нормативно-правовому обеспечению проведения статистических наблюдений, а также соблюдению конфиденциальности пообъектных данных.
Установление потребностей пользователей позволяет планировать наблюдение таким образом, чтобы публикуемые данные были представлены в понятной и удобной для использования форме.
Обязательным требованием качества публикуемых данных является сопровождение итогов наблюдения соответствующей метаинформацией, то есть материалами по методике проведения расчета показателей наблюдения, включая необходимую информацию в части статистических классификаций и охвата объекта наблюдения.
Качество программы и формуляра статистического наблюдения.Использование гармонизированных систем показателей и классификаций – одно из основных требований для обеспечения сопоставимости статистических данных, результатов наблюдений. Поэтому данные, предоставляемые пользователям, приведены в строгое соответствие с используемым Госкомстатом России Каталогом статистических показателей.
Обязательным требованием для органов статистики является обеспечение однозначного понимания респондентами вопросов формуляров проводимых статистических наблюдений. Для этого стандартные классификации и определения показателей должны быть доступны пользователям в печатном и электронном виде, в том числе в сети Интернет (www.gks.ru).
В процессе проектирования и использования статистических формуляров в Госкомстате России, как правило, выполняются три основных требования:
1. Создание логически ясного бланка наблюдения, в котором используются лаконичные и легко воспринимаемые респондентами вопросы и пояснения.
2. Оценивание качества разработанного бланка (ясность вопросов) до проведения наблюдения по результатам пилотных апробаций, включая анализ его эффективности в смысле корректности ответов респондентов и процента заполняемости основных вопросов бланка, а также наличия у респондентов необходимых первичных данных.
3. Осуществление «обратной связи» по результатам проведения наблюдения, т.е. внесение необходимых изменений для повышения качества бланка в случае его использования в последующих наблюдениях.
По данным пилотной апробации статистического формуляра многих обследований проводится анализ качества его заполнения. При этом по каждому вопросу определяются такие характеристики, как доля бланков: с ошибками заполнения и измерения, с пропусками, а также признанных корректно заполненными.
Качество данных статистических регистров. Для практической организации наблюдений органы государственной статистики создают и поддерживают в актуальном состоянии систему регистров – перечней единиц наблюдения, отвечающих реальным генеральным совокупностям, с ограниченным набором признаков идентификации, классификации и основных статистических характеристик. Одним из ключевых факторов для формирования статистической информации высокого качества является организация эффективного контроля за полнотой охвата исследуемых совокупностей, для чего проводится управление и обслуживание регистров.
Списочные статистические основы для отраслевых и межотраслевых наблюдений предприятий формируются на базе Генеральной совокупности объектов статистического наблюдения и создаваемых на ее основе отраслевых субрегистров. Качество данных регистра определяется полнотой охвата генеральной совокупности и актуальностью имеющихся данных, включая их достоверность. При использовании данных регистров (и других статистических и административных баз данных) учитывается и контролируется фактор запаздывания поступления в них информации и степень влияния этого фактора на сводные итоги проводимых наблюдений.
Генеральная совокупность объектов статистического наблюдения формируется и фиксируется по состоянию на 1 января текущего года. Поэтому, чем продолжительнее период времени, прошедший с момента ее формирования до организации конкретного наблюдения, тем меньше актуальность данных создаваемой основы.
Например, данные квартального наблюдения деятельности малых предприятий (форма № ПМ) актуализируют Генеральную совокупность объектов статистического наблюдения в части изменения видов деятельности, как правило, только при ее очередном формировании. Изменение этих сведений в течение года осуществляется в исключительных случаях.
При проведении экономических наблюдений приходится учитывать, что совокупности предприятий характеризуются значительной степенью неоднородности. Имеется ограниченное число единиц большого размера, которые вносят значительный вклад в сводные итоги. Кроме того, их организационная структура может быть достаточно сложной, включая несколько местных единиц, относящихся к различным отраслям экономики, также возможно наличие соподчиненной иерархии принятия экономических решений (например, холдинги и финансово-промышленные группы).
В настоящее время осуществляется переход от юридических лиц как фактической наименьшей единицы регистра к их обособленным подразделениям (местным единицам). Наличие информации по местным единицам позволит рассчитывать показатели по чистым видам деятельности и малым территориальным областям наблюдения, более эффективно планировать выборочные наблюдения, т.е. повысить точность и достоверность их результатов, а также поможет проанализировать влияние на качество статистических данных соотношения экономических и статистических единиц.
Демографические процессы слияния (объединения) и внутренняя реорганизация предприятий может оказать значительное влияние на качество сводной информации. Отсутствие сведений о произошедших изменениях может привести к значительным ошибкам в сводных итогах наблюдений по причинам пропусков или, наоборот, дублирования данных крупных организаций. Основная задача при этом состоит в отслеживании изменений структуры и месторасположения крупных единиц.
При статистическом наблюдении малых предприятий основная проблема обеспечения необходимого качества сводных итогов заключается в учете влияния факторов возникновения и ликвидации единиц в генеральной совокупности. Практически всегда вследствие этого одновременно имеет место неполнота и избыточность охвата совокупности объектов наблюдения. Другой причиной неполноты охвата и выхода за рамки наблюдения (обследование единиц фактически не относящихся к исследуемой генеральной совокупности) является недостаточная актуальность классифицирующей информации, например, по осуществляемым видам экономической деятельности.
Выборка. Качество итогов выборочного статистического наблюдения характеризуется достоверностью рассчитанных по выборке оценок показателей.
Результаты выборочного наблюдения практически всегда несколько отличаются от истинных, неизвестных на момент проведения наблюдения, значений показателей изучаемой генеральной совокупности. Эти отклонения – ошибки выборки, могут быть систематическими или случайными.
Систематические ошибки выборки имеют место в тех случаях, когда нарушен принцип случайности отбора и в выборку попали единицы, обладающие нехарактерными свойствами для всех единиц генеральной совокупности. Случайные ошибки обусловлены тем обстоятельством, что даже при тщательном планировании выборка не может в точности воспроизвести структуру генеральной совокупности. Поэтому случайные ошибки «присущи» несплошному наблюдению и вполне допустимы, если они малы и могут быть оценены статистически.
Для измерения полной ошибки выборки используется средний квадрат ошибки оценки показателя (СКО), который измеряет ошибку оценки показателя относительно истинного значения параметра совокупности:
СКО | = | Дисперсия оценки показателя | + | Смещение1) в квадрате. |
СКО является критерием достоверностиоценки, который характеризует величину отклонения рассчитываемого значения показателя от его истинного значения. Если смещение отсутствует или достаточно мало, то средний квадрат ошибки практически равен дисперсии оценки показателя, которая является характеристикой точности выборочного наблюдения.