Информационные процессы

Информационные процессы - student2.ru

Под сбором первичной информации здесь и далее понимается процесс получения необходимых сведений, данных от внешних по отношению к ИС и внутренних источников. Этот процесс подразумевает наличие таких этапов как анализ внешней и внутренней среды, выбор источников информации и методов сбора, организация ее приема и регистрации, а также ввода в систему.

Источниками информации могут служить любые объекты окружающего нас мира: предметы живой и неживой природы, события, явления, процессы (физические, экономические, социальные и прочие), а также сами информационные системы различного назначения и принадлежности. Это могут быть люди, владеющие не только сведениями о себе, но и профессиональными знаниями в определенной предметной области, а также предприятия и организации, включая средства массовой информации (СМИ).

Выбор источников информации и методов ее сбора во многом определяется результатами анализа внешней среды. Критериями выбора источника служат:
· надежность и доступность источника;
· необходимость и достоверность предоставляемых им сведений;
· стоимость информационных услуг;
· совместимость формы существующего у источника представления информации с требованиями информационной системы потребителя.

Среди методов сбора нерегламентированной информации можно выделить:
· непрерывный мониторинг процессов и явлений;
· статистическое обследование информационных объектов;
· приобретение информации по подписке;
· электронный поиск в информационных сетях;
· разведка.

Из перечисленных методов сбора особый интерес представляет статистическое обследование, различные формы проведения которого (опрос, анкетирование, перепись) требуют специальных подходов. Целью таких обследований, как правило, является получение оценок параметров или характеристик внешней или внутренней среды управляемой системы (например, предприятия или государства), необходимых для улучшения качества управления. В основе любого статистического обследования лежит получение информации от большого количества независимых, но однотипных источников, например, таких как человек или какой-нибудь товар массового производства. При этом для получения удовлетворительных оценок нет необходимости обследовать всю совокупность этих источников, т.е. проводить полную перепись. Достаточно ограничиться информацией, взятой у некоторой представительной выборки, а оценку получить последующей статистической обработкой в соответствии с существующими методами.

Однозначное формализованное описание всех данных, используемых при решении задач СОД, обеспечивающее автоматизацию процессов хранения, поиска, обработки и выдачи данных без искажения их смысла, осуществляется с помощью средств формализованного описания экономической информации, в состав которых входит система общегосударственных и локальных классификаторов, с помощью которых идентифицируются различные объекты, устанавливаются их свойства. Вопросам классификации при разработке информационного обеспечения придается большое значение.

Особое место в структуре любого экономического показателя занимает призначная информация. С помощью реквизитов-признаков становится возможным поиск, группировка, упорядочение и другие операции с показателями. Для этого призначная информация должна быть классифицирована, а затем и закодирована, т.е. представлена в цифровом или алфавитно-цифровом виде. Для этой цели создают классификаторы.

Классификатор – это документ, с помощью которого осуществляется формализованное описание экономической информации.

Основными объектами классификации и кодирования являются справочные реквизиты. Это могут быть используемые в системе управления предприятием наименования материальных, трудовых ресурсов, основных средств, инструментов, готовой продукции, деталей, сборочных единиц, услуг, клиентов, договоров, поставщиков и т. д. Полные поименованные множества таких объектов называют номенклатурой (например, номенклатура основных средств; номенклатура выпускаемой продукции; номенклатура работающих и т. д.). К объектам классификации относят также документы, деловые процессы, функции управления, организационные структуры и компоненты ЭИС – файлы, задачи, модули и т.д.

Под классификацией понимают процесс и результат упорядоченного распределения объектов заданного множества.

Для полной формализации экономической информации недостаточно простой классификации. Необходимо, присвоить каждому объекту номенклатуры условное обозначение. Этот процесс называют кодированием. Кодирование производится в строгом соответствии с правилами и структурой, определенными при классификации, и однозначно закрепляет за элементом множества условное обозначение. Система кодирования задает совокупность правил, по которым обозначаются элементы множества.

Код – это условное обозначение объекта в соответствии с принятой системой классификации. Код базируется на определенном алфавите и может быть цифровым, буквенным и смешанным.

Различают регистрационные и классификационные системы кодирования. Регистрационные системы не предполагают предварительной классификации, это порядковая и серийно-порядковая системы кодирования. Классификационные системы кодирования делят на последовательные и параллельные, причем первые обычно опираются на иерархическую классификацию, вторые – на многоаспектную.

При разработке экономических информационных систем (ЭИС) должна быть выполнена работа по созданию классификаторов. Они должны быть изданы в такой форме, которая предусматривает удобство его ведения, почти всегда это бумажный и электронный носитель.

Классификаторы могут быть международные, общегосударственные, отраслевые и локальные.

Международные классификаторы входят в состав Системы международных экономических стандартов [СМЭС] (классификация основных продуктов – КОП, Международная стандартная отраслевая классификация всех видов экономической деятельности – МСОК, международная стандартная торговая классификация – МСТК, международная стандартная классификация образования – МСКО, классификация европейского сообщества – КЕС, общая отраслевая классификация экономической деятельности в рамках ЕС – КДЕС и множество других).

В РФ для обеспечения совместимости существующих общегосударственных классификаторов разработана ЕСКК – единая система классификации и кодирования. Структура ЕСКК представлена на рисунке.

Информационные процессы - student2.ru

Штриховой код - это последовательность чередования широких и узких, темных и светлых полос, которым присвоены логические значения 1 и 0 (широким линиям и широким промежуткам присваивается логическое значение 1, узким 0).

UPC – универсальный товарный код (разработан в США);

EAN – товарный код, созданный в ЕС на базе UPC, соответствующий названию Европейской ассоциации товарной нумерации, получившей статус Международной организации (EAN International);

EAN – товарный код, созданный в ЕС на базе UPC, соответствующий названию Европейской ассоциации товарной нумерации, получившей статус Международной организации (EAN International);

В РФ применение штриховых кодов UPC-12, EAN-8, EAN-13, EAN-14 регулируется Ассоциацией автоматической идентификации, в состав которой входит более 2000 членов. Эта организация устанавливает номера предприятий в кодах EAN-13, EAN-14 и коды продуктов в коде EAN-8.

В России разработаны и эксплуатируются общероссийские классификаторы: ОКОГУ - общероссийский классификатор органов государственной власти и управления, ОКП – продукции; ОКПО – предприятий и организаций; ОКВ - общероссийский классификатор валют, ОКУД – управленческой документации и другие. Локальные классификаторы включают, как правило, коды структурных подразделений, коды видов работ и т.п. Использование штриховых кодов обеспечивает совместную деятельность производителей и потребителей товаров на едином товарном рынке. Данная технология предоставляет оперативный учет товаров, позволяет управлять потоками информации о передвижении и использовании продукции, поиск сведений об этих процессах по запросу в реальном масштабе времени на основе идентификации любого объекта, участвующего в этом процессе. Дополнительно эта технология ускоряет обмен информацией как внутри фирмы, так и между сотрудничающими фирмами с помощью методов и средств электронного обмена данными.

Накопленная первичная информация, прошедшая предварительную обработку в форме отбора, систематизации и сохранения в форматированном виде, может использоваться для решения многих задач анализа, планирования, прогнозирования и управления в социально-экономических системах. Постановка этих задач, как правило, связана с необходимостью получения на основе исходных накопленных данных производной информации, помогающей пользователю информационной системы принимать правильные решения. Такой производной информацией могут служить различные экономические, технические и др. показатели, параметры математических моделей, значения факторов, воздействующих на управляемый социально-экономический, технический или иной процесс, и многое другое.

В зависимости от способа получения, достоверности и объема исходной информации при ее обработке могут применяться как методы статистического анализа, так и математические методы обработки данных. Отбор и загрузка информации в обработку производится или в пакетном режиме (для статистической информации) или в диалоговом режиме (для оперативной информации) с использованием методов поиска необходимых данных.

Среди статистических методов обработки можно выделить две группы методов: предварительной обработки и статистического анализа. К первым методам относят группировку и сводку данных. Группировка данных представляет собой выделение части данных из общей совокупности по одному признаку или сочетанию нескольких признаков. Суммирование данных обеспечивает их количественную оценку как по всей совокупности данных (простая сводка), так и по отдельным группам этой совокупности (групповая сводка). Эти виды обработки обычно используют на первом этапе решения многих статистических задач.

БАЗЫ ДАННЫХ

В традиционной файловой системе файлы данных создаются и обрабатываются конкретными приложениями, т.е. программами пользователей, которым требуются данные из системы. Так, для финансового отдела нужно создать приложение, в котором будет использоваться файл записей о клиентах с полями номер счета, сумма на счете. Если в отделе продаж вводится система обработки заказов, то для приложения потребуется файл обработки счетов, в котором тоже нужны поля номер счета, сумма на счете. Таким образом, имеются два файла, содержащие одинаковые, т.е. избыточные данные. Избыточность, помимо ненужных затрат, приводит к возникновению ошибок.

В БД файлы не привязаны к конкретным приложениям. Напротив, они объединены таким образом, чтобы содержащиеся в них данные могли использоваться множеством приложений. В идеале все данные записываются один раз, хотя и обрабатываются разными приложениями. Физически БД представляют собой файлы, доступ к которым осуществляется приложениями не непосредственно, а путем обращения к системе управления базами данных (СУБД). Особенностью файлов базы является хранение не только самих данных, но и описаний их структуры. Таким образом, в БД файлы снабжены описанием хранимых в них данных и находятся под управлением СУБД. Дадим определением БД.

База данных (БД) - набор данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными.

База знаний (БЗ) - Средства для получения сведений, явно не хранящихся в БД. Принципиальными различиями обладают три модели представления знаний - продукционная модель, фреймовая и модель семантических сетей.

Создаются и используются базы данных средствами СУБД. Современные БД могут иметь практически неограниченное число записей, содержать мультимедийную информацию, предоставлять возможность публикации данных базы на Web (в том числе с использованием интерактивных страниц), предоставлять данные для хранилищ данных и др. Проектирование БД является сложной задачей, требующей специальной подготовки, и в настоящее время осуществляется, как правило, с использованием CASE (Computer Aided System Engineering) – средств (а именно, средств компьютерной поддержки технических систем). Создание и ведение БД возлагается на одного специалиста (или группу специалистов), являющегося администратором БД.

Подавляющая часть современных БД отвечает реляционной модели. Такие БД называются реляционными. Основной единицей организации данных в них являются таблицы, соответствующие обычным двумерным таблицам, привычным пользователям, в частности, экономистам. В таблицах БД столбцам соответствуют поля, а строкам - записи. Между таблицами устанавливаются связи (отношения) для возможности получения необходимых данных из двух и более таблиц. Так в простейшей БД ЗАКАЗ могут быть созданы две таблицы: «Заказ» и «Клиент», связанные между собой

Система управления базами данных (СУБД ) - комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.

Базы данных:

- Централизованные

- Распределённые

Распределенная БД (РБД) –

набор файлов (таблиц), хранящихся в разных узлах информационной сети и логически связанных таким образом, чтобы составлять единую совокупность данных.

Централизованная БД -

База данных с объектами, размещающимися в одном узле сети – на одном центральном компьютере, являющимся сервером БД.

Информационные процессы - student2.ru

Основные требования к БД:

•Целостность данных

•Актуальность данных

•Многоаспектное использование данных

•Возможность модификации БД

•Надежность

•Скорость доступа к данным

•Быстрота разработки БД

Модели данных

Модель данных – это совокупность взаимосвязанных структур данных, операций над ними и множества ограничений для хранимых данных.

Выбор той или иной модели данных связан с определенной гипотезой о строении предметной области и, как следствие, с некоторыми допущениями. Исторически сложилось так, что первой появилась иерархическая модель данных, затем сетевая. Обе эти модели для создания БД уже не используются, однако созданные БД продолжают действовать. В 1970 году Э. Коддом была предложена реляционная модель, являющаяся в настоящее время наиболее распространённой. Э. Кодд явился и автором многомерной модели, широко используемой в хранилищах данных. Начиная с 90-х годов, разрабатывается и применяется объектно-ориентированная модель данных.

Реляционная модель

Описание отображаемой предметной области базируется на гипотезе о том, что моделируемую область можно рассматривать как совокупность нескольких множеств, между элементами которых существуют некоторые отношения. Основными элементами модели являются реляционные таблицы и связи между ними. В каждой таблице содержатся сведения об одной сущности. В исходных таблицах, из которых данные вводятся в таблицы БД, столбцы должны иметь уникальные имена, содержать данные только одного типа (либо числа, либо текст и т.п.), быть неделимыми и не иметь пустых и повторяющихся строк. Структура таблицы определяется составом и последовательностью ее полей с указанием типа элементарного данного, размещаемого в поле. Основными типами данных являются: числовой, текстовый, дата/время, логический. Содержание таблицы заключено в ее записях. Каждая запись содержит данные о конкретном экземпляре сущности. Для однозначного определения каждой записи таблица должна иметь уникальный ключ (ключевое поле или совокупность нескольких полей), называемый первичным ключом.

Некоторые виды функциональной зависимости могут приводить к избыточности данных в базе. Для ее устранения (минимизации) при проектировании реляционных БД используется нормализация – процесс преобразования данных от одной нормальной формы к другой, боле высокой. Нормальные формы (НФ) формируются последовательно и по возрастанию (1НФ, 2НФ, 3НФ), и чем больше номер, тем больше ограничений на хранимые значения должно соблюдаться в соответствующей реляционной таблице. Любая реляционная таблица находится в первой нормальной форме (1НФ).

Во второй нормальной форме (2НФ) в таблице не должно быть полей, зависящих только от части составного ключа (а не от него целиком). Так, например, в таблице «Булочная», содержащей поля «Хлебозавод», «Продукт», «Цена» и «Количество», цена на одинаковые продукты разных заводов может быть назначена одна. В этом случае ключом будет совокупность полей «Хлебозавод + Продукт». Так как батоны нарезные хлебозаводов «Пекаря», «Кушелевского» и «Каравая» будут стоить одинаково, поле «Цена» будет зависеть только от части ключа – от поля «Продукт». Для устранения неполной функциональной зависимости необходимо разделить исходную таблицу на две. В первой таблице будут поля «Хлебозавод», «Продукт» и «Количество», а во второй – «Продукт» и «Цена».

Информационные процессы - student2.ru

Некоторые виды функциональной зависимости могут приводить к избыточности данных в базе. Для ее устранения (минимизации) при проектировании реляционных БД используется нормализация – процесс преобразования данных от одной нормальной формы к другой, боле высокой. Нормальные формы (НФ) формируются последовательно и по возрастанию (1НФ, 2НФ, 3НФ), и чем больше номер, тем больше ограничений на хранимые значения должно соблюдаться в соответствующей реляционной таблице. Любая реляционная таблица находится в первой нормальной форме (1НФ).

Третья нормальная форма. Транзитивная функциональная зависимость атрибутов X и Y отношения R (существует такой атрибут Z, что имеются функциональные зависимости X→Z и Z →Y, но отсутствует функциональная зависимость Z →X.) Сотрудник (X) Должность(Y) Зарплата(Z)

Информационные процессы - student2.ru

Иерархическая модель

Описание отображаемой предметной области в иерархической модели данных базируется на гипотезе о том, что моделируемую область можно рассматривать как иерархию объектов. Вся предметная область, представляющая некоторый класс объектов, разбивается на подклассы, каждый подкласс на подклассы более низкого уровня и т.д. Это модель типа дерево. Иерархическая модель организует данные в виде структуры, состоящей из узлов и ветвей. Наивысший уровень называется корнем. На нижних уровнях находятся предки по отношению к нижестоящим узлам и потомки по отношению к вышестоящим. Каждый потомок может быть связан только с одним предком, а один предок может иметь 0, 1 или N потомков. Доступ к каждому потомку выполняется через его непосредственного предка, и существует единственный иерархический путь доступа к любому узлу, начинающийся с корня дерева. В схеме иерархической БД узлы иерархической модели представляют сущности (информационные объекты), а дуги – связи между ними. Для БД определен порядок обхода – «сверху - вниз», «слева - направо». В иерархической БД для поддержания целостности данных должно выполняться правило: никакой потомок не может существовать без своего предка.

Достоинствами этой модели являются простота понимания и использования. Недостатками – в первую очередь, не универсальность модели: для большинства задач требуется дублирование данных, возможна потеря данных, связи «многие - ко - многим» могут быть реализованы только искусственно при избыточности данных; а во вторую очередь – допустимость только навигационного принципа доступа к данным, (последовательным перемещением по БД для нахождения требуемой записи), записи извлекаются по одной, и чтобы извлечь некое множество данных, нужно повторять операции извлечения повторно. Непосредственный доступ по ключу, как правило, возможен только к объекту самого высокого уровня (корневому). Типичным представителем иерархических БД является IMS (Information Management System) компании IBM.

Информационные процессы - student2.ru

Сетевая модель данных

Сетевая модель по сравнению с иерархической является более универсальной. В ней возможен доступ по ключу не только к объекту на высшем уровне иерархии, но и к объектам любого уровня. В данной модели возможно обеспечить связи «многие-ко-многим», отсутствие дублирования данных и формирование запросов. Однако ее существенными недостатками является сложность, т.е. обилие понятий, вариантов их взаимосвязей и особенностей реализации. Такие усложнения приводят к необходимости хранения вместе с данными множества указателей, а также допустимость только навигационного принципа доступа к данным.

Информационные процессы - student2.ru

Наши рекомендации