Разработка ИС «Оценка портфельных инвестиций»
Постановка задачи
Основной задачей ИС «Оценка портфельных инвестиций»является вычисление рисков инвестиционного портфеля для дальнейшего их анализа и оценки для инвестиционного проекта. ИС будет решать задачи по:
- безопасностью вложений;
- стабильность получений дохода;
- ликвидность вложений ;
Которые будут внедряться в предприятия ОАО «Венера» и «Сатурн».
Функции информационных систем. Функции, которые должны выполнять информационные системы для решения стоящих перед ними задач, связанны с поддержкой динамической информационной модели предметной области и с удовлетворением информационных потребностей ее пользователей.
К числу этих функций относятся сбор и регистрации информационных ресурсов, их хранение, обработка, актуализация, а также обработка запросов пользователей.
Сбор и регистрация информационных ресурсов. Эти функции обеспечивают «фотографирование» предметной области, формирование и поддержку на этой основе модели предметной области экстенсионального уровня. Функции сбора и регистрации информационных ресурсов могут совмещаться во времени или выполняться последовательно. Возможны различные варианты их осуществления, например:
-путем измерений (наблюдений) фактов в реальном мире и ввода данных в систему вручную с помощью клавиатуры и/или каких-либо манипуляторов;
-полуавтоматически путем ввода в компьютер с некоторых носителей и в случае необходимости их оцифровки (например, при использовании текстов на бумажных носителях или аналоговых аудиозаписей);
-автоматически с помощью различного рода датчиков или обмена .данными с другими автоматизированными системами.
С этими функциями связана необходимость решения ряда сопутствующих задач, таких как очистка данных, верификация данных, сжатие данных, конвертирование данных из одного формата в другой и т.д.
Очистка данных — необходимая стадия предварительной обработки данных и подготовки их к загрузке в систему, особенно в случаях, когда используется несколько источников данных. Обычно она включает процедуры фильтрации данных, верификации, обеспечения логической целостности, устранения несогласованности, избыточности и различных ошибок, восполнения пропусков, а также другие процедуры, направленные на улучшение качества данных. В результате фильтрации производится отбор нужных данных из множества имеющихся в распоряжении.
Верификация данных обеспечивает достоверность и логическую целостность данных. Проверка достоверности данных — это содержательная процедура, которая позволяет установить, адекватно ли характеризуют состояние предметной области собранные для ввода в информационную систему информационные ресурсы.
Сжатие данных осуществляется с целью минимизации ресурсов памяти, необходимых для их хранения, а также для снижения затрат на передачу данных по коммуникационным каналам. ля рационального использования ресурсов памяти в некоторых классах систем, например в системах управления документами, документы подразделяются на активные и архивные. Хранение архивных документов осуществляется в сжатых форматах.
Конвертирование данных при вводе в систему используется для преобразования данных из одного формата в другой, допускающий автоматизированный импорт их в информационную систему. Конвертирование данных часто необходимо в случаях, когда источником данных является некоторая другая система.
Хранение информационных ресурсов. Эта функция информационных систем связана с необходимостью управления двумя видами ресурсов — ресурсами хранимых данных и ресурсами памяти. Требования к этим функциям различаются в разных классах информационных систем. В системах текстового поиска каждый документ хранится обычно в отдельном файле. Доступ к документам осуществляется с помощью структур данных, называемых индексами. Индексы в системах текстового поиска позволяют определять адрес размещения нужного файла по так называемым индексирующим свойствам хранящегося в нем документа — по значениям каких-либо атрибутов, ассоциированных с документом, по содержащимся в нем словам или словосочетаниям и т.п. При этом единицей доступа является полный документ. Управление памятью осуществляется в таких системах средствами компонента операционной системы компьютера, называемого файловой системой или системой управления файлами. Индексы документов в системах текстового поиска организуются в виде так называемых инвертированных списков. Для каждого значения индексирующего свойства документов в таких индексах поддерживаются адреса или идентификаторы файлов, их содержащих.
Более тонкую организацию имеют механизмы управления хранением данных, основанных на технологиях баз данных. Причины заключаются в том, что в системах баз данных используются более сложные структуры данных, требуется значительно более мелкая гранулярность доступа к ресурсам, более динамичный характер имеют хранимые данные.
Управление хранимыми данными в системах баз данных включает поддержку структуры хранимых данных, их размещение в пространстве памяти, поддержку физической целостности и обеспечение эффективного доступа к ним. Чаще всего используются прямой и последовательный доступ к единицам информационных ресурсов в каком-либо определенном порядке.
Среда хранения в системах баз данных также базируется на файловой организации. Однако над файловой системой надстраиваются механизмы, обеспечивающие более тонкие методы управления данными в терминах элементов содержания файлов. Единицей доступа здесь является, как уже отмечалось, не файл или порция файла, предусмотренная в файловой системе, а порции информационных ресурсов с гораздо более мелкой гранулярностью.
Обработка информационных ресурсов. Некоторые информационные системы способны предоставлять пользователям только информационные ресурсы, ранее введенные в систему и хранящиеся в ней без какой-либо трансформации. Такая ситуация чаще всего встречается в системах текстового поиска, которые выдают пользователю документы, удовлетворяющие условиям запроса. В то же время, системы баз данных способны продуцировать данные, производные от ранее введенных в систему и хранимых в базе данных. Достаточно упомянуть весьма развитое средство, предусмотренное для этих целей в реляционных СУБД, — механизм поддержки представлений данных (View). Продуцирование производных данных обеспечивается также в Web-сайтах с динамической генерацией страниц. Существуют текстовые информационные системы, позволяющие генерировать для хранимых документов их рефераты.
Обработка информационных ресурсов в информационных системах не сводится лишь к продуцированию производной информации. Обработка осуществляется и для выполнения ряда системных функций, например для проверки ограничений целостности, для поиска в индексах, словарях и т.п.
Актуализация информационных ресурсов
Назначение информационной системы состоит в поддержке динамической информационной модели ее предметной области. Для того чтобы эта модель была практически полезной, необходимо своевременно и адекватно отображать в ней изменения состояния предметной области. Требуется актуализировать модель. Для этой цели нужно актуализировать информационные ресурсы системы.
Актуализация информационных ресурсов системы заключается в приведении их в соответствие текущему состоянию предметной области системы. В реляционных системах баз данных эта задача сводится к включению и/или удалению строк в таблицах базы данных, обновлению значений столбцов в некоторых строках. В случаях, когда изменяется структура предметной области системы, актуализация информационных ресурсов заключается в изменении схемы базы данных — добавлении или удалении столбцов таблиц, существующих в базе данных, к созданию новых и/или удалению существующих таблиц и т.д.
В системах текстового поиска актуализация информационных ресурсов чаще всего осуществляется путем ввода в систему новых или (реже) удаления существующих документов.
При актуализации Web-сайта в состав его ресурсов включаются новые или удаляются существующие страницы, модифицируются гиперссылки, связывающие страницы данного сайта и, возможно, страницы других сайтов, редактируется содержание существующих страниц.
Актуализация информационных ресурсов в информационных системах производится дискретно, через определенные интервалы времени. Поэтому адекватность состояния модели предметной области и ее состояния в реальности обеспечивается с временным лагом, величина которого равна продолжительности указанных интервалов. Величина лага может изменяться для разных систем в довольно широком диапазоне времени и зависит от назначения системы и особенностей ее предметной области. В информационных системах, входящих в состав систем управления сложными техническими объектами, например в системе управления космическими полетами, лаг измеряется в миллисекундах. В корпоративных информационных системах он может составлять минуты и часы. В некоторых исследовательских экономических системах возможен лаг, составляющий дни, месяцы, кварталы и годы.
Для того чтобы информационная система соответствовала своему назначению, важно соблюдать установленный для нее регламент актуализации информационных ресурсов.
Предоставление информационных ресурсов пользователям. Поддержка в информационной системе информационных ресурсов, позволяющих моделировать состояние и поведение предметной области, конечно же, не является самоцелью. Это делается для удовлетворения информационных потребностей пользователей.
Предоставление информационных ресурсов пользователям информационной системы может осуществляться с помощью:
pull-технологий - инициатором предоставления является пользователь
push-технологий - инициатором предоставления является сама система, в соответствии с определенным регламентом и для определенного круга пользователей.
Pull-технология
Для предоставления информационных ресурсов по инициативе пользователя в информационной системе предусматриваются пользовательские интерфейсы — средства взаимодействия пользователей с системой. Характер пользовательских интерфейсов и их функции зависят от категории пользователей системы.
Пользовательский интерфейс в общем случае включает интерфейсные технические средства, язык или языки интерфейса, программные средства, поддерживающие функционирование интерфейсного оборудования и языков интерфейса.
Предполагается, что существует две категории пользователей информационных систем:
Конечные пользователи — специалисты в предметной области системы, обычно осуществляющие доступ к ее информационным ресурсам в интерактивном режиме;
Прикладные программы, использующие информационные ресурсы данной системы и являющиеся компонентами какого-либо ее приложения.
В простейшем случае информационные потребности конечных пользователей регламентированы, известен их перечень. Иногда они зависят от каких-либо параметров, например даты, названия продукта, фамилии покупателя. Таких пользователей способен удовлетворить так называемый «кнопочный» интерфейс. Каждому виду запросов в таком интерфейсе соответствует некоторая клавиша клавиатуры или альтернатива показываемого на экране меню. Нажатие соответствующей клавиши или выбор нужной альтернативы в меню приводит к выдаче пользователю интересующих его информационных ресурсов.
В большинстве случаев, однако, информационные потребности конечных пользователей имеют нерегламентированный характер. Поэтому интерфейс конечного пользователя в системе с такими возможностями должен включать какой-либо язык запросов.
Для взаимодействия конечных пользователей с информационной системой с помощью языков запросов служат два вида пользовательских интерфейсов:
интерфейсы командной строки - для ввода сообщений и команд в систему служит язык запросов, имеющий свой алфавит и синтаксические правила для конструирования из его символов правильных команд или операторов. В качестве языков запросов используются естественные и искусственные языки.
Естественные языки запросов обычно используются в системах текстового поиска и в поисковых машинах действующей версии Web. Некоторые такие системы имеют мультиязыковой интерфейс — запросы могут формулироваться на одном из естественных языков из заданного набора. Искусственные языки запросов применяются в системах, основанных на технологиях баз данных, а также в Web нового поколения и его приложениях. В настоящее время, как правило, используются непроцедурные декларативные языки запросов.
интерфейсы, основанные на языках четвертого поколения (4GL, 4th Generation Language). Языки четвертого поколения не являются языками в привычном смысле. Это пользовательские интерфейсы, которые обеспечивают ввод в систему сообщений с помощью выбора подходящих альтернатив в меню, ввода параметров через окна экранных форм, применения различных возможностей графического пользовательского интерфейса.
Пользователи системы — компоненты прикладного программного обеспечения — осуществляют доступ к ресурсам данной системы с помощью интерфейсов прикладного программирования (API, Application Programming Interface). Средства таких интерфейсов можно применять только в программах, создаваемых с помощью систем программирования, на которые эти интерфейсы рассчитаны. Доступ пользователей к ресурсам системы возможен только в пределах предоставленных им полномочий, которые обычно проверяются системными механизмами при попытках доступа. Наделение пользователей необходимыми полномочиями — функция системного администратора. Некоторые системы предоставляют свободный доступ к определенным ресурсам. Так, например, обстоит дело со многими Web-сайтами.
Push-технология
Эта технология широко применяется в последние годы для распространения различного рода информации среди пользователей Internet. С этой целью стандартное сообщение рассылается по списку рассылки всем пользователям, в нем зарегистрированным. По этому принципу функционируют многочисленные телеконференции в Internet. Таким же образом организовано информирование пользователей некоторых электронных библиотек о поступлении новых документов в библиотеку.
Однако, к сожалению, регистрация в списке рассылки осуществляется не всегда с учетом согласия пользователя. Одним из прибыльных сфер бизнеса в Internet стало коллекционирование действующих адресов пользователей сети. Базы данных, содержащие миллионы адресов, поставляются всем желающим за скромную плату. Такие базы данных охотно приобретаются недобросовестными рекламными службами коммерческих компаний, которые используют их для бездумной рассылки своей рекламы. Это привело к огромному росту трафика в Internet, к резкому снижению удельного веса полезной информации в потоках передаваемых в Internet сообщений.