Требования к компьютерной сети
Основным требованием к компьютерной сети является выполнение сетью того набора услуг, для которого она предназначена. К таким услугам могут относиться: доступ к файловым архивам; доступ к страницам веб-сайтов; обмен с использованием электронной почты; интерактивный обмен с помощью IР-телефонии; потоковое видео и т.д.
Все остальные требования (а это могут быть: производительность, надежность, совместимость, управляемость, защищенность, расширяемость и масштабируемость) связаны с качеством выполнения основной задачи.
Хотя важны все перечисленные требования, в понятие «качество обслуживания» для компьютерной сети часто включают только две важнейшие характеристики — производительность, надежность и безопасность.
Производительность.К основным характеристикам производительности относятся время реакции; скорость передачи данных; задержка передачи и ее вариация.
Время реакции определяют как интервал времени между возникновением запроса пользователя к какой-либо сетевой службе и получением ответа на этот запрос.
Обычно это время складывается из нескольких составляющих (рис. 7.6):
t1 - время подготовки запроса на пользовательском компьютере;
t2 - время передачи между клиентом и сервером;
t3 - время обработки запроса на сервере;
Рис. 7.6. Обмен «пользователь-клиент-сервер»
Сервер
- t4 - время доставки ответа с сервера на клиентский компьютер;
- t5 — время обработки ответа на этом компьютере.
С точки зрения работы сети важнейшими составляющими являются t2 и t4, т.е. задержки на передачу по сети.
Скорость передачи данных — определяется объемом данных, передаваемых в единицу времени. Используется также понятие пропускной способности — это скорость передачи пакетов между узлами сети через различные коммуникационные устройства. Скорость передачи измеряется:
- в битах в секунду;
- в пакетах в секунду. Различают три скорости.
1. Средняя скорость. Берется достаточно длительный промежуток времени (час, сутки) и общий объем переданных данных делится на время.
2. Мгновенная скорость. Для усреднения выбирается очень маленький промежуток времени — например, 10 мс или 1 с.
3. Максимальная скорость. Это максимальная мгновенная скорость, зафиксированная за время наблюдения.
При проектировании сети чаще всего пользуются параметрами средней и максимальной скорости.
Иногда оперируют и общей пропускной способностью, рассматриваемой как максимальное количество информации, передаваемой между всеми узлами сети в единицу времени.
Задерэюка передачи — время между моментом поступления данных на вход какого-то сетевого устройства или части сети и моментом появления этих данных на выходе, т.е. tзад = tвых – tвх.
Отличием этого параметра от времени реакции является то, что в tзад никогда не включается время на обработку в конечных узлах сети.
Обычно рассматривают максимальную задержку и вариацию задержки.
Надежность и безопасность.Для обычных технических средств используют такие показатели надежности, как: среднее время наработки на отказ; вероятность отказа;
- интенсивность отказов.
Однако эти характеристики пригодны для оценки только простых устройств, которые могут находиться в двух состояниях — работоспособном и отказа.
Сложные системы из многих элементов могут иметь и промежуточные состояния. Поэтому для оценки надежности таких сложных систем как сети применяют другой набор характеристик.
Готовность (или коэффициент готовности), Availability —-доля времени, в течение которого система может быть использована. Для увеличения коэффициента готовности в состав системы включают резервные элементы.
Сохранность данных (и их защита от искажений).
Согласованность данных (их непротиворечивость). Это требуется, например, когда несколько копий данных хранятся на разных файловых серверах.
Может также применяться параметр вероятность потери пакета (например, из-за переполнения буфера маршрутизатора, отсутствия работоспособного пути в сети, поражения пакета ошибками). Этот параметр может представляться в виде:
- вероятности искажения отдельного бита передаваемых данных;
- отношения числа потерянных пакетов к общему числу передаваемых пакетов.
Безопасность (Security) — способность системы защитить данные от несанкционированного доступа. Сюда относятся защита каналов, защита компьютеров, защита от взлома паролей и т.д.
Отказоустойчивость (Fault tolerance) способность системы скрывать от пользователя факт отказа отдельных элементов. Например, если копии данных хранятся на нескольких файловых серверах, пользователь может и не заметить факт отказа одного их них. В этом случае говорят о деградации системы, так как при отказе одного сервера увеличивается время доступа к базе данных из-за уменьшения степени распараллеливания запросов.
Специфичными для сетей являются параметры расширяемости и масштабируемости.
Расширяемость (Extensibility) — возможность легко добавлять в сеть новые элементы (пользователей, компьютеры, приложения, службы), наращивать длину сегментов и заменять аппаратуру более мощной.
Масштабируемость (Scalability) — возможность наращивания количества узлов и протяженности связей в сети в очень широких пределах. При этом производительность сети не ухудшается.
Часто термины «расширяемость» и «масштабируемость» используются как синонимы. Однако, если взять, к примеру, сеть Ethernet, то можно говорить о хорошей расширяемости (количество компьютеров на сегменте можно увеличить до 100), но при этом резко снижается производительность сети, т.е. это указывает на плохую масштабируемость.
Прозрачность (Transparency) сети достигается в том случае, когда для пользователя сеть представляется не как множество компьютеров, связанных сложной системой каналов, а как единая вычислительная машина с системой разделения времени.
Символом прозрачности считают принцип: «Сеть — это компьютер».
Прозрачность может достигаться на двух уровнях — пользователя и программиста.
Прозрачность на уровне пользователя — для работы в сети используются те же команды и привычные процедуры, что и для работы с локальными ресурсами.
Прозрачность на уровне программиста — приложению для доступа к удаленным ресурсам требуются те же вызовы, что и для локальных ресурсов.
Сеть должна скрывать различия операционных систем и компьютеров. Можно одинаково обращаться к ресурсам на компьютере с ОС Macintoch, Windows или Unix. От пользователя не требуется знание места расположения ресурса. Ресурсы должны свободно перемещаться с одного компьютера на другой без изменения их имен.
Поддержка разных видов трафика: наряду с традиционным трафиком передачи данных все увеличивается доля мультимедийного трафика — передаваемых в цифровой форме речи и изображения.
Особенность мультимедийного трафика — это жесткие требования к синхронизации передаваемых данных. При запаздывании сообщений наблюдаются искажения.
Необходимость передачи мультимедийного трафика требует внесения изменений как в протоколы, так и в оборудование.
В сети в общем случае должны сосуществовать два вида трафика:
- традиционный компьютерный (пульсирующий);
- мультимедийный (синхронный).
Это является сложной задачей и ближе всего к ее решению подошли сети АТМ.
Управляемость — возможность централизованно контролировать состояние основных элементов сети, выявлять и устранять неисправности, выполнять анализ производительности и планировать развитие сети.
В этой области еще очень много нерешенных проблем. В основном существующие системы не управляют сетью, а лишь осуществляют наблюдение за ее работой.
Совместимость (или интегрируемость) — способность сети включать в себя разнообразное ПО и аппаратное обеспечение, т.е. сеть может быть неоднородной или гетерогенной. Еще такие сети называют интегрированными.
В них могут сосуществовать различные ОС, стеки протоколов, аппаратные средства и приложения от разных производителей. Основной путь обеспечения совместимости — это использование открытых стандартов и спецификаций.
Традиционные сети обеспечивают сервис, который получил название «Best effort» — с максимальными усилиями. Это означает, что сеть не дает никаких гарантий на обслуживание, например сети Ethernet, Token Ring, IP, Х25.
При обработке очередей обычно используется алгоритм FIFO, а при переполнении буфера — пакеты отбрасываются.
В настоящее время самый распространенный путь обеспечения QoS — это постоянное наращивание пропускной способности сети, т.е. постоянно иметь избыточную пропускную способность. Встроенные механизмы QoS пока применяются только в таких сетях как АТМ и Frame Relay.
Типы QoS.Определяются соответствующими типами.
Сервис Best Effort — с максимальными усилиями. Это фактически отсутствие QoS. Обслуживание производится без каких-либо гарантий, например, IP-сети и Ethernet с принципом FIFO.
Сервис с предпочтением, (называют также «мягким» сервисом QoS). В этом случае некоторые виды трафика обслуживаются лучше остальных. Но характеристики обслуживания точно неизвестны — они зависят от характеристик трафика. Например, при высокой интенсивности высокоприоритетного трафика может совсем прекратиться обслуживание трафика с низким приоритетом.
Гарантированный сервис (называется также «жестким» или «истинным» сервисом QoS). Различным типам трафика даются статистические гарантии. Обычно этот тип QoS основан на предварительном резервировании сетевых ресурсов для каждого из потоков, получивших гарантии обслуживания. Однако и эти гарантии носят статистический характер. Например, с вероятностью 0,999 задержка пакета не должна превышать 100 мс.
При этом производится контроль интенсивности входных потоков — чтобы это значение не превышало заранее оговоренную величину. Такой тип QoS применяется обычно для обслуживания тех приложений, для которых нужны гарантии пропускной способности и/или задержек. Например, это может быть трафик видеоконференции или трафик, поступающий от измерительных систем реального времени.
Рассмотрим новые базовые сети и их роль в обеспечении качества обслуживания.
Эти сети являются основой вторичных сетей — компьютерных и телефонных. Как было показано выше, обеспечение QoS зависит от имеющегося резерва пропускных способностей, т.е. от производительности первичной сети. Без развития первичных сетей невозможен прогресс сетевых технологий.
Такие сети называют также опорными и первичными сетями.
Современные сети основаны на коммутации каналов. Для создания абонентского канала коммутаторы первичных сетей поддерживают один из методов мультиплексирования и коммутации.
В настоящее время для мультиплексирования абонентских каналов используют:
технику частотного мультиплексирования — FDM (Frequency Division Multiplexing);
мультиплексирование по длине волны WDM (Wave Division Multiplexing);
мультиплексирование с разделением времени — TDM (Time Division Multiplexing).
Частотное мультиплексирование применяется в основном в телефонных сетях, где речевой телефонный канал имеет спектр 300 — 3 400 Гц (т.е. на его передачу необходима пропускная способность 3 100 Гц). Кабельные же системы между телефонными коммутаторами имеют пропускную способность в сотни мегагерц. Для передачи производится модуляция высокочастотного сигнала низкочастотным. Таким образом, спектр модулированного сигнала переносится в другой частотный диапазон. Высокочастотный сигнал делится на полосы по 4000 Гц (3 100 4~ 900 страховой промежуток) . В сетях на основе РОМ-коммутации принято несколько уровней уплотненных каналов. Это базовая группа (12 абонентских каналов), супергруппа (60 абонентских каналов) и главная группа (600 абонентских каналов), которая имеет полосу пропускания 2520 КГц (564—3084 КГц).
В первичных сетях с мультиплексированием по длине волны (WDM и DWDM) используется тот же принцип частотного разделения, но информационным сигналом в них является не электрический ток, а свет. Используется инфракрасный диапазон с длинами волн от 850 до 1 565 нм, что соответствует частотам 196 — 350 ТГц.
В магистральном канале обычно мультиплексируется достаточно много спектральных каналов: 16, 32, 40, 80 или 160. Если используются 16 и более каналов, то такая техника часто называется плотной, т.е. Dense WDM или DWDM. Внутри спектрального канала данные могут кодироваться как дискретным, гак и аналоговым способами.
Коммутация каналов на основе разделения времени как уже упоминалось, эта техника носит название «Мультиплексирование с разделением времени» (Time Division Multiplexing, TDM). Основой этой технологии являются каналы Т1/Е1, которые были предложены для передачи вызовов между телефонными станциями (АТС). Это дуплексные цифровые каналы.
Для передачи используются две пары витых проводников (по паре в каждую сторону). В 1990-е гг. эти каналы стали очень популярны в качестве средства подключения абонентов (небольших фирм, корпоративных сетей) к сети Internet.
На базе внедренных в телефонии каналов Т1 к настоящему времени сформировались два поколения таких цифровых базовых сетей:
- технология плезиохронной цифровой передачи (Plesiochronous Digital hierarchy, PDH). «Плезио» означает «почти», т.е. это почти синхронная передача;
- синхронная цифровая иерархия (Sinchronous Digital Hierarchy, SDH). В США технология SDH называется SONET.
К недостаткам технологии PDH относятся:
- сложность мультиплексирования и демультиплексирования данных. Например, для извлечения одного канала из потока ТЗ надо демультиплексировать канал до Т2, затем — до Т 1, а уже затем демультиплексировать канал Т1;
- отсутствие встроенных средств контроля и управления сетью. Нет и процедур поддержки отказоустойчивости;
- слишком низкие (по понятиям современных сетей) скорости передачи. Иерархия скоростей Е1 заканчивается на 139 Мбит/с, а современные оптоволоконные каналы позволяют передавать со скоростью в десятки гигабит в секунду.
Эти недостатки были устранены в сетях SDH, которые и стали в настоящее время одним из тех типов сетей, который позволяет удовлетворить требования к качеству обслуживания.
Технология синхронной цифровой иерархии (Sinchronous Digital Hierarchy, SDH) разработана для создания надежных транспортных каналов, позволяющих гибко формировать цифровые каналы в широком диапазоне скоростей — от единиц мегабит в секунду до десятков гигабит в секунду.
Основная область применения — первичные сети операторов связи. Эти сети относятся к классу полу постоянных сетей с коммутацией каналов — формирование канала происходит по инициативе оператора связи. Поэтому чаще всего вместо термина «коммутация» используют термин «кросс-коннект» (cross-connect). Используется мультиплексирование с разделением времени TDM. Информация адресуется путем относительного временного положения внутри составного кадра. Обычно эти сети используют для объединения большого числа более низкоскоростных каналов PDH. На рис. 7.7 приведен пример структуры сети SDH.
Рис. 7.7. Пример структуры сети 8ВН
Достоинствами сетей SDH являются:
гибкая иерархическая система мультиплексирования цифровых потоков с различными скоростями. Возможность ввода и вывода пользовательской информации без демультиплексирования потока в целом:
- отказоустойчивость сети. Использование резервных маршрутов и резервного оборудования. Переход на резервный путь обычно требует не более 50 мс;
- мониторинг и управление сетью на основе той информации, которая встроена в заголовки кадров;
- высокое качество транспортного обслуживания для трафика любого вида — голосового, видео и компьютерного. Техника мультиплексирования TDM, лежащая в основе SDH, обеспечивает трафику каждого абонента гарантированную пропускную способность, а также низкий и фиксированный уровень задержек.
Сети SDH составляют сегодня фундамент практически всех крупных телекоммуникационных сетей — региональных, национальных и между народных.
Эти сети легко интегрируются с сетями DWDM, обеспечивая передачу информации по оптическим магистралям со скоростями сотни гигабит в секунду за счет мультиплексирования с разделением по длине волны (рис. 7.8).
В сетях DWDM сети SDH играют роль сетей доступа, т.е. ту же роль, что играют по отношению к ним сети PDH.
К типовым топологиям относятся кольца, линейные цепи и ячеистая топология, близкая к полносвязной.
Вторым типом современных базовых сетей, которые позволяют обеспечить поддержку служб, имеющих требуемое качество обслуживания, являются сети DWDM.
Рис. 7.8. Иерархия базовых сетей и сетей доступа
Технология плотного волнового (спектрального) мультиплексирования SWDM (Dense Wave Division Multiplexing) предназначена для создания оптических магистралей нового поколения, работающих на мультимегабитных и терабитных скоростях.
Информация в оптическом волокне передается одновременно большим количеством световых волн.
Сети DWDM работают по принципу коммутации каналов — при этом каждая световая волна представляет собой отдельный спектральный канал.
Каждая волна несет свою собственную информацию, при этом оборудование DWDM не занимается непосредственно проблемами передачи данных на каждой волне, т.е. способом кодирования информации и протоколом ее передачи.
Устройства DWDM занимаются только объединением различных волн в одном световом пучке, а также выделением из общего сигнала информации каждого спектрального канала.
Оборудование DWDM позволяет передавать по одному оптическому каналу 32 и более волн различной длины в окне прозрачности 1 550 нм. При этом каждая волна может переносить информацию со скоростью до 10 Гбит/с (при применении протоколов STM-64 или 10GE). Ведутся работы по повышению этой скорости до 40 80 Гбит/с.
Мультиплексирование DWDM называется «плотным», так как в нем используется существенно меньшее (чем у предшествующей технологии WDM) расстояние между длинами волн.
Рис. 7.9. Интервалы между каналами
В рекомендации С.692 определен частотный план с разнесением частот на 100 ГГц (Dl = 0,8 нм). Для передачи используется 41 волна: от 1 528 нм (191 ТГц) до 1 560 нм (192 ТГц). Определен также частотный план с разнесением на 50 ГГц (Dl = 0,4 нм), что позволяет передавать в этом диапазоне 81 волну.
Имеются экспериментальные образцы с разнесением на 25 ГГц. Такая технология называется High Dence WDM (HDWDM).
Как видно на рис. 7.9, необходимо обеспечить высокую точность частоты, чтобы не допустить перекрытия спектра каналов.
Преимуществами технологии DWDM являются:
— высокий коэффициент использования частотного диапазона оптоволокна;
—отличная масштабируемость — достаточно просто добавить новые спектральные каналы;
—экономическая эффективность — не требуется электрическая регенерация на длинных маршрутах;
—независимость от протокола передачи через магистраль DWDM можно передавать трафик сетей любого типа;
—независимость спектральных каналов друг от друга;
—совместимость с технологией SDH. Мультиплексоры DWDM оснащаются интерфейсами STM-N, способными принимать и передавать данные мультиплексоров SDH;
—совместимость с технологиями Ethernet — Gigabit Ethernet и 10GE;
—стандартизация на уровне Международного союза по телекоммуникациям ITU-Т.
Обработка информации
Обработка информации состоит в получении одних «информационных объектов» из других «информационных объектов» путем выполнения некоторых алгоритмов и является одной из основных операций, выполняемых с информацией и главным средством увеличения ее объема и разнообразия.
На самом верхнем уровне можно выделить числовую и нечисловую обработки. В указанные виды обработки вкладывается разная трактовка понятия «данные». При числовой обработке используются такие объекты, как переменные, векторы, матрицы, многомерные массивы, константы и т.д. При нечисловой обработке объектами могут быть файлы, записи, поля, иерархии, сети, отношения и т.д. Другое отличие заключается в том, что при числовой обработке содержание данных не имеет большого значения, в то время как при нечисловой обработке необходимы непосредственные сведения об объектах, а не их совокупность в целом.
С точки зрения реализации на основе современных достижений вычислительной техники выделяют такие виды обработки информации:
- последовательная обработка, применяемая в традиционной фоннеймановской архитектуре ЭВМ, располагающей одним процессором;
- параллельная обработка, характеризующаяся наличием нескольких процессоров в ЭВМ;
- конвейерная обработка, связанная с использованием в архитектуре ЭВМ одних и тех же ресурсов для решения разных задач, причем если эти задачи тождественны, то это последовательный конвейер, если задачи одинаковые — векторный конвейер.
Принято относить существующие архитектуры ЭВМ с точки зрения обработки информации к одному из следующих классов.
Архитектуры с одиночным потоком команд и одиночным потоком данных (SISD) — традиционные фоннеймановские однопроцессорные системы, где имеется центральный процессор, работающий с парами «атрибут — значение».
Архитектуры с одиночным потоком команд и множественным потоком данных (SIMD) — особенность данного класса — наличие одного (центрального) контроллера, управляющего рядом одинаковых процессоров. В зависимости от возможностей контроллера и процессорных элементов, числа процессоров, организации режима поиска и характеристик маршрутных и выравнивающих сетей выделяют:
- матричные процессоры, используемые для решения векторных и матричных задач;
-- ассоциативные процессоры, применяемые для решения нечисловых задач и использующие память, в которой можно обращаться непосредственно к информации, хранящейся в ней;
- процессорные ансамбли, применяемые для числовой и нечисловой обработки;
- конвейерные и векторные процессоры.
Архитектуры с множественным потоком команд и одиночным потоком данных (MISD) — конвейерные процессоры.
Архитектуры с множественным потоком команд и множественным потоком данных (MIMD) — мультипроцессорные системы, системы с мультобработкой, вычислительные системы из многих машин, вычислительные сети.
Основные процедуры обработки данных представлены на рис. 7.10.
Создание данных как процесс обработки предусматривает их образование в результате выполнения некоторого алгоритма и дальнейшее использование для преобразований на более высоком уровне.
Модификация данных связана с отображением изменений в реальной предметной области, осуществляемых путем включения новых данных и удалением ненужных.
Рис. 7.10. Основные процедуры обработки данных
Безопасность и целостность направлены на адекватное отображение реального состояния предметной области в информационной модели и обеспечивают защиту информации от несанкционированного доступа (безопасность) и от сбоев и повреждений технических и программных средств.
Поиск информации, хранимой в памяти компьютера, осуществляется как самостоятельное действие при выполнении ответов на различные запросы, так и вспомогательная операция при обработке информации.
Поддержка принятия решения является наиболее важным действием, выполняемым при обработке информации. Широкая альтернатива принимаемых решений приводит к необходимости использования разнообразных математических моделей [25, 32].
Создание документов, сводок, отчетов заключается в преобразовании информации в формы, пригодные для чтения как человеком, так и компьютером. С этим действием связаны и такие операции как обработка, считывание, сканирование и сортировка документов.
Преобразование информации осуществляет ее перевод из одной формы представления или существования в другую и определяется потребностями, возникающими в процессе реализации информационных технологий.
Реализация всех действий, выполняемых в процессе обработки информации, осуществляется с помощью разнообразных программных средств. Наиболее распространенной областью применения технологической операции обработки информации является принятие решений.
В зависимости от степени информированности о состоянии управляемого процесса, полноты и точности моделей объекта и системы управления, взаимодействия с окружающей средой процесс принятия решения протекает в условиях определенности, риска, неопределенности и многокритериальности.
При принятии решений в условиях определенности модели объекта и системы управления считаются заданными, а влияние внешней среды несущественным. Поэтому между выбранной стратегией использования ресурсов и конечным результатом существует однозначная связь, откуда следует, что в условиях определенности достаточно использовать решающее правило для оценки полезности вариантов решений, принимая в качестве оптимального то, которое приводит к наибольшему эффекту. Если таких стратегий несколько, то все они считаются эквива-
лентными. Для поиска решений в условиях определенности используют методы математического программирования.
В отличие от предыдущего случая для принятия решений в условиях риска необходимо учитывать влияние внешней среды, которое не поддается точному прогнозу, а известно только вероятностное распределение ее состояний. В этих условиях использование одной и той же стратегии может привести к различным исходам, вероятности появления которых считаются заданными или могут быть определены. Оценку и выбор стратегий проводят с помощью решающего правила, учитывающего вероятность достижения конечного результата.
При принятии решений в условиях неопределенности как и в предыдущей задаче, между выбором стратегии и конечным результатом отсутствует однозначная связь. Кроме того, неизвестны также значения вероятностей появления конечных результатов, которые либо не могут быть определены, либо не имеют в контексте содержательного смысла. Каждой паре «стратегия — конечный результат» ставится в соответствие некоторая внешняя оценка в виде выигрыша. Наиболее распространенным является использование критерия получения максимального гарантированного выигрыша.
Принятие решений в условиях многокритериалъности возникает в случае наличия нескольких самостоятельных, не сводимых одна к другой целей. Наличие большого количества решений усложняет оценку и выбор оптимальной стратегии. Одним из возможных путей решения является использование методов моделирования.
Решение задач с помощью искусственного интеллекта заключается в сокращении перебора вариантов при поиске решения, при этом программы реализуют те же принципы, которыми пользуется в процессе мышления человек.
Экспертная система пользуется знаниями, которыми она обладает в своей узкой области, чтобы ограничить поиск решения задачи путем постепенного сужения круга вариантов.
Методы решения задач в экспертных системах:
- метод логического вывода, основанный на технике доказательств, называемой резолюцией и использующей опровержение отрицания (доказательство «от противного»);
— метод структурной индукции, основанный на построении дерева принятия решений для различения объектов из большого количества данных на входе;
- метод эвристических правил, основанных на перенимании опыта у экспертов-людей, а не на абстрактных правилах формальной логики;
- метод машинной аналогии, основанный на представлении информации о сравниваемых объектах в удобном виде, например, в виде структур данных, называемых фреймами.
Источники «интеллекта», проявляющегося при решении задачи, могут оказаться бесполезными либо полезными или экономичными в зависимости от определенных свойств области, в которой поставлена задача. Исходя из этого, может быть осуществлен выбор метода построения экспертной системы или использования готового программного продукта.
Процесс выработки решения на основе первичных данных (рис. 7.11) можно разбить на два этапа: выработка допустимых вариантов решений путем математической формализации с использованием разнообразных моделей и выбор оптимального решения на основе субъективных факторов.
Рис. 7.11. Процесс выработки решения на основе первичных данных
Информационные потребности лиц, принимающих решение, во многих случаях ориентированы на интегральные технико-экономические показатели, которые могут быть получены в результате обработки первичных данных, отражающих текущую деятельность предприятия. Анализируя функциональные взаимосвязи между итоговыми и первичными данными можно построить так называемую информационную схему, которая отражает процессы агрегирования информации. Первичные данные, как правило, чрезвычайно разнообразны, интенсивность их поступления высока, а общий объем на интересующем интервале велик. С другой стороны, состав интегральных показателей относительно мал, а требуемый период их актуализации может быть значительно ниже периода изменения первичных данных — аргументов.
Для поддержки принятия решений обязательным является наличие таких компонентов, как обобщающий анализ, прогнозирование, ситуационное моделирование.
Система поддержки принятия решений (СППР) может быть представлена как автоматизированная интерактивная человеко-машинная система поддержки принятия решений на основе использования данных и моделей. СППР предназначены для поддержки управленческих решений и интуитивного подхода к решению управленческих задач. Для этого они обеспечивают пользователей необходимой информацией, генерируют, оценивают и предлагают несколько вариантов. Системы поддержки принятия решений входят в состав практически любой современной информационной системы. Понятие информационной системы (ИС) и понятие системы поддержки принятия решений являются взаимодополняющими. В соответствии с характером обработки информации в ИС на различных уровнях управления заданной системой (оперативном, тактическом и стратегическом) выделяются три типа информационных подсистем — системы обработки данных (EDP – Electronic Data Processing); информационная система управления (MIS – Management Information System); система поддержки принятия решений (DSS – Decision Support System).
Для задач СППР свойственны недостаточность имеющейся информации, ее противоречивость и нечеткость, преобладание качественных оценок целей и ограничений, слабая формализованность алгоритмов решения. В качестве инструментов обобщения чаще всего используются средства составления аналитических отчетов произвольной формы, методы статистического анализа, экспертных оценок и систем, математического и имитационного моделирования.
Таким образом, СППР — это автоматизированная система, используемая для различных видов деятельности при принятии решений в ситуациях, когда невозможно или нежелательно иметь автоматическую систему, полностью выполняющую весь процесс решения, вследствие слабой структурированности или неструктурированности решаемых проблем.
Такая «система поддержки принятия решения» может состоять из нескольких подсистем, реализующих 7 основных функций СППР:
1) оценка обстановки (ситуации), выбор критериев и оценка их относительной важности;
2) генерация возможных решений (сценариев действий);
3) оценка решений (сценариев действий) и выбор лучшего;
4) обмен информацией об обстановке принимаемых решений и согласование групповых решений (в тех случаях, когда это возможно);
5) моделирование принимаемых решений (в тех случаях, когда это возможно);
6) динамический компьютерный анализ возможных последствий принимаемых решений;
7) сбор данных о результатах реализации принятых решений и оценка результатов.
СППР зачастую используют как интегрированные подсистемы в составе сложных комплексов управления и контроля. Для подобных интегрированных СППР можно выделить несколько основных функций:
обеспечение ЛПР информацией для процесса принятия решения, включая ее предварительную обработку;
организационно-методическое обеспечение процесса принятия решений;
моделирование последствий принятия решений;
экспертные функции: выдача рекомендаций и обоснований;
обеспечение согласованности решений, принимаемых в группах.
Модель процесса принятия решений человеком включает три основные ступени: интеллектуальную ступень, конструирование и выбор. Термин «поддержка» подразумевает различные шаги и задачи на каждом этапе процесса принятия решений.
В зависимости от данных, с которыми СППР работают, их можно разделить на оперативные (предназначенные для немедленного реагирования на текущую ситуацию); стратегические (основанные на анализе большого количества информации из разных источников с привлечением сведений, содержащихся в системах, аккумулирующих опыт решения проблем).
Оперативные СППР получили название Информационных Систем Руководства (ИСР — Executive Information Systems). По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из информационной системы предприятия или OLTP-системы. Для ИСР характерно следующее:
- отчеты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико;
— отчеты представляются в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т.п.;
система ориентирована на конкретный вертикальный рынок, например финансы, маркетинг, управление ресурсами.
Стратегические СППР предполагают достаточно глубокую проработку данных, специально преобразованных так, чтобы их было удобно использовать в ходе процесса принятия решений. Неотъемлемым компонентом СППР этого уровня являются правила принятия решений, которые на основе агрегированных данных подсказывают менеджерскому составу выводы и придают системе черты искусственного интеллекта. Такого рода системы создаются только в том случае, если структура бизнеса уже достаточно определена и имеются основания для обобщения и анализа не только данных, но и процессов их обработки.
Большая часть используемых сегодня СППР разработана для генерации и оценки альтернатив посредством анализа «что-если» и «поиска цели» на этапах конструирования и выбора.
Финансовые модели служат для поддержки и планирования, рассчитывая последствия запланированных действий на основе оценки прибылей.
Репрезентативные модели оценивают последствия действий (принятия решений) на основе комплекса моделей, включая все имитационные модели.
Оптимизирующие модели находят оптимальные решения.
Предлагающие модели дают специальное решение для четко структурированных задач. Такие системы выполняют механические вычисления и не оставляют места управленческому суждению.
Управление данными и моделями в СППР практически неразделимо, поэтому многие исследователи фокусируют внимание на обеих сторонах вопроса, на управлении и данными, и моделями. Данные представляют собой фактические результаты наблюдения за физическими явлениями, например, это могут быть размеры суточного выпуска продукции, объем дневных продаж и уровень запасов продукта А. База данных содержит совокупность взаимосвязанных файлов.
Управление данными в СППР — это необходимая функция, используемая, главным образом, на интеллектуальной стадии процесса принятия решений, но недостаточная для поддержки этапов конструирования и выбора альтернатив. Для поддержки этих этапов СППР должны обеспечить выполнение таких операций, как проекция, дедукция, анализ, генерация альтернатив, сравнение альтернатив, оптимизация и имитация. При выполнении этих задач СППР используют различные типы моделей из областей знаний об управлении и исследовании операций. Эти модели включают линейное программирование, целочисленное программирование, сетевые модели, программирование целей, имитационные и статистические модели и электронные таблицы.
Другой важной, развивающейся в последнее время разновидностью СППР, являются системы поддержки принятия решений, основанные на базе знаний (СППРБЗ), которые представляют собой гибрид СППР и ЭС и предназначены для решения широкого круга организационных задач. В интегрировании СППР и ЭС выделяются два основных подхода: экспертные системы поддержки (ЭСП) и интеллектуальные системы поддержки (ИСП). Основные различия между этими системами заключаются в следующем — ЭСП предназначены для замены живого эксперта машинным экспертом, а задачи ИСП заключаются в поддержке знаний отдельных пользователей и групп. Широкий ряд управленческих задач реального мира легче поддается решению, если используются как количественные, так и качественные данные. Новая интегрированная система (ЭСП или ИСП) может помогать ЛПР, используя знания и опыт ключевых фигур в организации. Узким местом при разработке систем, основанных на знаниях, таких как ЭСП например, является задача приобретения знаний: этот процесс состоит из представления знаний, проверки, механизма построения логических выводов, механизмов объяснения и управления.
Множество новых средств и технологий способно расширить возможности СППР, среди них важное место занимает интеллектуальный анализ данных (ИАД), обычно определяемый как метод поддержки принятия решений, основанный на анализе зависимостей между данными [23]. Существуют два подхода автоматизации поиска зависимостей между данными.
В первом подходе, используемом в традиционной технологии анализа, пользователь сам выдвигает гипотезы относительно зависимостей между данными. Гипотеза приводит к построению отчета, анализ отчета — к выдвижению новой гипотезы и т.д. Такая методика действует и в том случае, когда пользователь применяет такие развитые средства, как OLAP, поскольку процесс поиска по-прежнему полностью контролируется человеком. Во многих системах ИАД в этом процессе автоматизирована проверка достоверности гипотез, что позволяет оценить вероятность тех или иных зависимостей в базе данных.
Второй подход основан на автоматическом поиске зависимости между данными. Увеличивающееся количество продуктов, реализующих автоматический поиск зависимостей, подтверждает растущий интересе производителей и потребителей к системам именно такого типа.
Процессы ИАД подразделяются на три большие группы: поиск зависимостей (discovery), прогнозирование (predictive modelling) и анализ аномалий (forensic analysis). При поиске зависимостей осуществляется просмотр базы данных и автомагическое выявление зависимостей. Проблемой здесь является отбор действительно важных зависимостей из огромного числа существующих в БД. Прогнозирование основано на том, что пользователь предъявляет системе записи с незаполненными полями и запрашивает недостающие значения. Система сама анализирует содержимое базы и делает правдоподобное предсказание относительно этих значений. Анализ аномалий заключается в процессе поиска подозрительных данных, сильно отклоняющихся от устойчивых зависимостей.
Необходимость оперативной обработки стремительно возрастающих объемов информации вызвало к жизни появление и активное развитие технологии интеллектуального анализа данных (ИАД или data mining). Теоретической базой ИАД являются методы математической статистики и искусственного
интеллекта. Сложность решаемых задач потребовала создания специализированных инструментальных средств, ориентированных на конечного пользователя и предназначенных для решения как типовых, так и специфических задач в различных предметных областях.
Областями применения ИАД являются научные исследования, образование, статистика, здравоохранение, производство, финансы, правоохранительная и военная деятельность.
Разнообразие решаемых задач вынуждает разработчиков создавать исследовательские ИАД, предназначенные для работы с новыми типами проблем, и прикладные ИАД, ориентированные на решение типовых задач. Каждый из классов систем может быть ориентирован как на специалистов, так и непрограммирующих пользователей.
К сожалению, универсальные средства ИАД довольно сложны и дороги, поэтому они не могут широко применяться в рамках интегрированных систем, ориентированных на конечного пользователя. В основу технологии ИАД положен не один, а несколько принципиально различных подходов (табл. 7.1), причем использование некоторых из них невозможно без специальной подготовки [46]. Выбор подхода нередко требует привлечения специалиста по ИАД.
Таблица 7.1. Основные технологии интеллектуального анализа данных
Технология | Область применения | Недостатки |
Правила вывода | Работа с данными, связанными отношениями, представленными в виде правил «если то» | Потеря наглядности при большом количестве правил; не всегда удается выделить отношения «если то» |
Нейронные сети | Работа с нелинейными зависимостями , зашумленными и неполными данными | Модель типа «черный ящик» не позволяет объяснить выявленные знания, при этом данные обязательно должны быть преобразованы в числовой вид |
Нечеткая логика | Ранжировка данных по степени близости к желаемым результатам; нечеткий поиск в базах данных | Из-за новизны технологии в настоящее время известно ограниченное число специализированных приложений |
Визуализация | Многомерное графическое представление данных (пользователю самому представляется возможность выявить закономерности отношений между данными) | Зависимость интерпретации модели от аналитика |
Статистика | Научные и инженерные приложения, характеризуемые наличием большого числа алгоритмов и опыта их применения | Крен в сторону проверки гипотез, а не выявления новых закономерностей в данных |
К- ближайший сосед | Выявление кластеров, обработка целостных источников данных | Требует больших объемов памяти, проблемы с чувствительностью |
Интегрированные технологии | Выбор подходов, адекватных задачам, или их сравнение | Сложность средств поддержки; высокая стоимость. Для каждой отдельно взятой технологии не всегда реализуется наилучшее решение |
Одним из основных подходов к поиску и выборке данных является оперативная аналитическая обработка (OLAP – Online Analytical Processing). Общеизвестно, что OLAP-системы построены на двух базовых принципах:
все данные, необходимые для принятия решений, предварительно агрегированы на всех соответствующих уровнях и организованы так, чтобы обеспечить максимально быстрый доступ к ним;
язык манипулирования данными основан на использовании бизнес-понятий.
Так как в основе OLAP лежит понятие гиперкуба, или многомерного куба данных, в ячейках которого хранятся анализируемые (числовые) данные, то дальнейшее усложнение модели данных может идти по нескольким направлениям:
- увеличение числа измерений. Например, данные о статьях не только по месяцам и годам, но и по темам. В этом случае куб становится трехмерным;
- усложнение содержимого ячейки. В этом случае в ячейке будет несколько значений признаков;
введение иерархии в пределах одного измерения. Например, общее понятие «время» естественным образом связано с иерархией значений: год состоит из кварталов, квартал из месяцев и т.д.
Имеется в виду не физическая структура хранения, а лишь логическая модель данных, т.е. определяется лишь пользовательский интерфейс модели данных. В рамках этого интерфейса должны быть введены определенные базовые операции:
- поворот;
- проекция — при проекции значения в ячейках, лежащих на оси проекции, суммируются по некоторому предопределенному закону;
- раскрытие (drill-down) — одно из значений измерения заменяется совокупностью значений из следующего уровня иерархии измерения; соответственно заменяются значения в ячейках гиперкуба;
- свертка (roll-up/drill-uo) — операция, обратная раскрытию;
- сечение (slice-and-dice).
В зависимости от ответа на вопрос, существует ли гиперкуб как отдельная физическая структура или лишь как виртуальная модель данных, различают системы MOLAP (Multidimensional OLAP) и ROLAP (Relational OLAP). В первых гиперкуб реализуется как отдельная база данных специальной нереляционной структуры, обеспечивающая максимально эффективный по скорости доступ к данным, но требующая дополнительного ресурса памяти. MOLAP-системы весьма чувствительны к объемам хранимых данных, поэтому данные из хранилища сначала помещаются в специальную многомерную базу (Multidimensional Data Base, MDB), а затем эффективно обрабатываются OLAP-сервером.
Реализация процесса принятия решений заключается в построении информационных приложений. Выделим типовые функциональные компоненты, необходимые для формирования любого приложения на основе баз данных (БД) [41):
- PS (Presentation services) средства представления. Обеспечиваются устройствами, принимающими ввод от пользователя и отображающими то, что сообщает ему компонент логики представления PL, плюс соответствующая программная поддержка. Может быть текстовым терминалом или Х-терми-налом, а также персональным компьютером или рабочей станцией в режиме программной эмуляции терминала или Х-терминала;
— PL (Presentation Logic) — логика представления. Управляет взаимодействием между пользователем и ЭВМ. Обрабатывает действия пользователя по выбору альтернативы меню, нажатию кнопки или выбору элемента из списка;
— BL (Business or Application Logic) — прикладная логика. Набор правил для принятия решений, вычислений и операций, которые должно выполнить приложение;
— DL (Data Logic) — логика управления данными. Выполняет операции с базой данных (SQL-операторы SELECT, UPDATE и INSERT), которые необходимы для реализации прикладной логики управления данными;
— DS (Data Services) — операции с базой данных. Действия системы управления БД (СУБД), вызываемые для выполнения логики управления данными, такие как манипулирование данными, определения данных, фиксация или откат транзакций и т.п. СУБД обычно компилирует SQL-приложения;
— FS (File Services) —- файловые операции. Дисковые операции чтения и записи данных для СУБД и других компонент. Обычно являются функциями ОС.
Среди средств разработки информационных приложений можно выделить: традиционные системы программирования: инструменты для создания файл-серверных приложений: средства разработки приложений клиент-сервер: средства автоматизации делопроизводства и документооборота: средства разработки Internet/Intranet приложений: средства автоматизации проектирования приложений.
Хранение информации
Хранение и накопление — одни из основных действий, осуществляемые с информацией, и главное средство обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющими направлениями реализации этих операций является концепция базы данных, хранилища данных [39].
База данных совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.
Система баз данных — совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.
Хранилище данных (Склад данных —• ХД, Информационное хранилище — Data Warehouse) база данных, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД: агрегирование данных; данные из ХД никогда не удаляются; пополнение ХД происходит на периодической основе; автоматическое формирование новых агрегатов данных, зависящих от старых; доступ к ХД осуществляется на основе многомерного куба или гиперкуба.
Витрины данных (Data Mart), альтернатива хранилищу данных — множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.
Репозитарий в упрощенном виде можно рассматривать просто как базу данных, предназначенную для хранения не пользовательских, а системных данных. Технология репозита-риев проистекает от словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.
Каждый из участников действия (пользователь, группа пользователей, «физическая память») имеет свое представление об информации.