Задачи системы контроля ИС
Под контролем в информационных системах понимают процессы, обеспечивающие обнаружение ошибок в их функционировании, вызванных отказами или сбоями аппаратуры, ошибками в программе, ошибками оператора или другими причинами. В сочетании с мерами по резервированию контроль является одним из самых эффективных средств повышения надежности и достоверности обработки информации в вычислительных системах.
В современных ИС применяют средства автоматизированного контроля и диагностики, называемые системой контроля и диагностики. Которые выполняют следующие функции:
· Обнаружение ошибок;
· Определение причин и характера ошибок;
· Регистрация ошибок и ситуаций, в которых имело место возникновение ошибок (сбор статистики и информации об ошибках);
· Исправление ошибок;
· Поиск (диагноз) неисправностей;
· Реконфигурация системы;
· Ремонт (замена неисправных компонент);
· Проверка работоспособности системы (после ремонта или конфигурации).
В данной лекции рассматриваются методы контроля, предназначенные для обнаружения ошибок, вызванных отказами и сбоями аппаратуры.
«Ошибка» в ряде случаев целесообразно рассматривать как явление искажения информации, поддающееся с определенной вероятностью обнаружению и регистрации. Для обнаружения ошибок в работе информационных систем широко используют различные методы контроля, позволяющие зафиксировать наиболее типичные ошибки. Поэтому необходимо знание причин и характеристик возникающих ошибок для правильного выбора метода контроля. Сбои, зафиксированные системой контроля, устраняют, и тем самым не допускается их распространение на выход системы . При обнаружении систематической ошибки требуется локализовать и устранить причину ошибки.
Средства контроля ИС подразделяются на аппаратные, программные и
смешанные. Они характеризуются тремя основными параметрами: полнотой (глубиной) контроля, временем обнаружения ошибки и сложностью.
Полнота контроля оценивается как доля отказов, обнаруживаемых в результате контроля, от общего их количества:
где MK - множество элементов, подлежащих контролю;
M - множество всех элементов системы;
ni - число элементов i-го типа;
li - интенсивность отказов элементов i-го типа.
Время обнаружения ошибки (время контроля) определяется как интервал времени от момента возникновения ошибки до момента ее обнаружения.
Сложность средств контроля характеризуется массой, размерами, стоимостью, потребляемой энергией, памятью и другими параметрами аппаратных средств.