Методы обработки и анализа полученной нформации
В данной работе основным методом обработки и анализа полученной информации являлся дескриптивный анализ – систематизация эмпирических данных, их наглядное представление в форме графиков-гистограмм и частотных таблиц, а также их количественное описание и содержательная интерпретация.
В настоящее время основной трудностью осуществления массовых обследований является организация процедуры получения, обработки и анализа разноплановой информации у больших контингентов испытуемых. «Ручной» способ обработки данных в силу своей трудоемкости и ненадежности за последние десятилетия в практике массовых обследований последовательно был вытеснен: а) автоматическим считыванием графической информации ЭВМ с бланков в виде макетированных перфокарт; б) использованием компьютерных классов для группового компьютерного тестирования; в) применением автоматизированных рабочих мест с комплексом специальных «зашитых» программ для компьютерного ввода результатов исследований как с помощью клавиатуры, так и с помощью сканера (аппаратно-программных комплексов); г) использованием открытых высокоточных систем потокового ввода больших объёмов разноплановых данных с бумажных и электронных носителей с возможностью дистанционной обработки и передачи данных по сети интернет.
Наш более чем 20-летний опыт работы в сфере массовых полевых обследований показывает, что наиболее надежным и оптимальным способом потокового ввода больших объёмов данных на сегодняшний день является использование одной из лучших в мире технологий распознавания ABBYY FormReader (Flexi Capture Engine) - системы автоматизированного ввода форм, заполненных от руки с применением технологии ICR (Intelligent Character Recognition). Неоспоримыми преимуществами данной системы являются: 1) 10-кратное уменьшение времени на ввод данных с бумажных форм; 2) 20-кратное повышение точности итоговых данных благодаря заслужившим признание во всём мире технологиям распознавания ABBYY (OCR, ICR and OMR/Barcode) и 98% уровень корректного распознавания рукописных символов; 3) возможность использования на локальной рабочей станции и интеграции функций FormReader во внешние приложения; 4) способность обрабатывать любые типы форм, соответствующие простым требованиям машиночитаемости; 5) распознавание печатного текста (OCR), текста, написанного печатными буквами от руки (ICR) с уровнем корректного распознавания 98%, а также меток (OMR) и штрих-кодов (OBR); 6) отсутствие потребности во вмешательстве оператора на этапах сканирования и распознавания; 7) возможность проверки оператором символов, относительно которых у системы распознавания сложилось несколько гипотез; 8) трехступенчатая технология верификации – групповая, контекстная и "в форме", позволяющая подобрать оптимальный вариант проверки для каждого типа данных и гарантировать высокую их достоверность; 9) возможность экспорта подтверждённых данных (результатов ввода) в файлы форматов Microsoft Excel, TXT, DBF, CSV, в базы данных или информационную систему; сохранения изображений в виде pdf-файлов; 10) сведение к нулю влияния человеческого фактора оператора с абсолютным исключением "позиционных" ошибок; 11) автоматический контроль результатов распознавания вводимых данных с помощью готовых или задаваемых правил проверки, сверок по словарям и базам данных, правил контроля сумм и др.; 12) возможность автоматизировать весь процесс ввода, обработки и экспорта данных с бумажных носителей в файл или базу данных; 13) высокая производительность, позволяющая силами одного сотрудника вводить ежедневно от 500 до 1000 страниц в зависимости от сложности формы и аппаратной конфигурации (наличие скоростного сканера позволяет сканировать не менее 10 страниц в минуту).
Использование открытых высокоточных систем потокового ввода данных позволяет осуществлять массовые социологические и психодиагностические обследования традиционным путем, используя брошюрные варианты тестов и специальные регистрационные бланки для автоматизированной обработки с использованием сканера. Предпочтительное использование бумажных носителей информации кроме экономического (нет необходимости в наличии специальных компьютерных классов для тестирования) и методологического (нет необходимости в проведении обязательной специальной рестандартизации тестовых методик, используемых в компьютерном варианте), имеет еще и важный для ситуации скрининга и мониторинга правовой аспект, связанный с заполнением испытуемыми бланковых форм от руки и наличием личной подписи кандидата, что особенно актуально при возникновении и рассмотрении различного рода юридических коллизий.
В настоящем исследовании перевод первичных эмпирических материалов в электронную базу данных осуществлялся с использованием технологии распознавания ABBYY FormReader. В последующем с помощью компьютерной программы статистической обработки SPSS Statistics полученные данные были систематизированы и структурированы.
1. Кингисеппский муниципальный район Ленинградской области |
Характеристика выборки
Выборочная совокупность в Кингисеппском муниципальном районе составила 100 опрошенных, среди которых 17,3% составили мужчины, 82,7% - женщины (рисунок 1.1).
Рисунок 1.1– Гендерное распределение респондентов в социологической выборке жителей Кингисеппского района.
Образовательный состав респондентов выглядит следующим образом: 76,77% ответивших имеют высшее и незаконченное высшее образование (из них - 1,01% имеют учёную степень), 18,18% респондентов имеют среднее и неполное среднее образование (рисунок 1.2)
Рисунок 1.2– Распределение респондентов по образовательному уровню в социологической выборке жителей Кингисеппского района.
Возрастное распределение опрошенных следующее: группа респондентов от 20 до 30 лет составляет 19%, от 30 до 40 лет – 29%, старше 40 лет – 40%. Младшая возрастная группа занимает 12% выборочной совокупности (рисунок 1.3).
Рисунок 1.3– Возрастное распределение респондентов в социологической выборке жителей Кингисеппского района.
В исследуемой выборке 84% опрошенных проживают в Кингисеппском муниципальном районе свыше 15 лет (рисунок 1.4).
Рисунок 1.4– Распределение респондентов по срокам проживания в Кингисеппском муниципальном районе.
Экономические ресурсы
Современное развитие территорий невозможно без производимой на них промышленной и сельскохозяйственной продукции. Не только объемы продукции, но и ее качество являются для проживающего населения своеобразным социально-экономическим барометром, т.е. брендом района. Экономический потенциал района играет большую роль и в его туристской привлекательности. В этой связи жителям Кингисеппского района было предложено назвать три наиболее известных вида промышленной продукции, производимой в их районе. Ответы распределились следующим образом: подавляющее большинство (90%) назвали минеральные удобрения, производимые на ОАО «Фосфорит». Далее следуют строительные материалы. Их назвали 25% участников исследования. Декоративную стеклотару (стекольная промышленность) отметили 21% респондентов (рисунок 1.5).
Рисунок 1.5.Распределение частоты ответов на вопрос «Назовите три вида промышленной продукции, которую можно считать гордостью Вашего района?».
Следует особо отметить, что структура частоты ответов на вопрос: «Назовите три вида промышленной продукции, которую можно считать гордостью Вашего района» представлена следующим образом: на первом месте находятся минеральные удобрения (49,7%), на втором – строительные материалы (13,8%), третье место занимает декоративная стеклотара – 11,6% (рисунок 1.6).
Рисунок 1.6.Структура частоты ответов на вопрос «Назовите три вида промышленной продукции, которую можно считать гордостью Вашего района?».
В экономические задачи района, связанные с развитием туризма входит удовлетворение туристских потребностей в сувенирной продукции и других предметах туристского спроса. Из всех названных респондентами видов производимой продукции можно выделить производство декоративной стеклотары, которая вполне могла бы быть использована в сувенирной отрасли. Имидж региона как туристского центра может страдать от производств экологически вредной продукции.
По основным видам сельскохозяйственной продукции (рисунок 1.7) в лидирующую тройку вошли - мясная, овощная и молочная продукция (79%, 74% и 59%, соответственно).
В структуре ответов, касающихся сельскохозяйственной продукции (рисунок 1.8), первое место принадлежит мясной продукции. Ее назвали 26,9% респондентов. При этом среди населения района наиболее известными являются колбасные изделия местного производства. Так считают 91,5% респондентов, принявших участие в опросе (рисунок 1.9). На втором месте находится овощная продукция (рисунок 1.10). В этой группе продукции наиболее часто респонденты называют морковь (70,3%), свеклу (15,0%) и капусту (9,5 %). Третье место принадлежит молочной продукции (указали 20,1% от числа опрошенных).
Рисунок 1.7.Распределение частоты ответов на вопрос «Назовите три вида сельскохозяйственной продукции, которую можно считать гордостью Вашего района?».
Рисунок 1.8.Структура частоты ответов на вопрос «Назовите три вида сельскохозяйственной продукции, которую можно считать гордостью Вашего района?».
Рисунок 1.9.Структура частоты ответов по блоку «Мясная продукция».
Рисунок 1.10.Структура частоты ответов по блоку «Овощная продукция».
Из молочных продуктов чаще других были названы молоко и творог (69,62% и 27,9% соответственно), другая молочная продукция (2,53%) (рисунок 1.11).
Рисунок 1.11.Структура частоты ответов по блоку «Молочная продукция».
Близость Кингисеппского района к Финскому заливу (водным акваториям) позволяет его населению гордиться рыбной продукцией, в частности, добываемой миногой. Так считают 70,2% респондентов, принявших участие в данном эмпирическом исследовании (рисунок 1.12).
Рисунок 1.12.Структура частоты ответов по блоку «Рыбная продукция».
Развитие в последние годы гастрономического туризма предполагает возможности продвижения имиджа района как производителя пищевых продуктов. Среди названных продуктов на 1 место можно поставить миногу, которая могла бы войти в изображение логотипа района, делая его еще более привлекательным для гастрономического туризма.