Сбор аварийных сигналов в узле с дублированной управляющей группой
Передача файлов с сообщениями о состоянии аварийных сигналов узла
В каждой управляющей группе контролируемого узла находится агент SNMP.
В узле MN находится менеджер SNMP. Соединение между узлом и MN устанавливается посредством TCP/IP. При каждом изменении аварийного состояния узла агент SNMP передает ловушку SNMP в MN и таким образом извещает менеджер SNMP об изменении в узле. Менеджер SNMP затем передает запрос на прием всех имеющихся в наличии аварийных сигналов и аварийного состояния узла.
Соединение TCP/IP контролируется каждые 10 с.
Каждые 30 минут автоматически обновлается аварийное состояние каждого контролируемого узла. С помощью прикладной программы FMG специалист по техническому обслуживанию может требовать от менеджера SNMP обновления данных об аварийных сигналах. Передача архивных данных об аварийных сигналах по запросу специалиста по техническому обслуживанию может выполняться из прикладной программы FMG или периодически посредством автоматической активизации.
SNMP-менеджер |
MpsLog File.Log |
FMG |
SNMP ловушка |
запрос |
SNMP-агент |
Узел |
msgair msgerr msgstat |
Принцип обмена запросами на сбор аварийных сигналов между узлом и MN
Значение содержимого файлов с сообщениями о состоянии аварийных сигналов узла
Пользователю предлагаются четыре файлы с аварийными сообщениями (для соответствующей стороне), а именно:
• LogFile - находится в MN, содержит сообщения об аварийых сигналах всех узлов с дублированной управляющей группой, а также сообщения о соединении TCP/IP с контролируемыми агентами SNMP. Доступ к файлу осуществляется из окна Alarm Monitoring - команда File - History. Для обновления данных имеются в окне Alarm Monitoring команды Options - RefreshAII и Refresh для всех узлов. Для отдельного узла имеется в окнах Node: <узел: Hostname_1 - A side> или Node: <узел: Hostname_2 - В side> команда Refresh. Файл является общим для обеих сторон дублированной управляющей группы. Это окно в дальнейшем называется <узел: Hostname - A side> или <узел: Hostname - В side>.
Окно Alarm monitoring RefreshAll, Refresh File-History Open |
Окно <MPS> Refresh |
LogFile. |
FMG |
MN |
Создание файла и окна LogFile
Каждая сторона дублированной управляющей группы имеет собственные файлы msgalr, msgerr и msgstat:
* msgalr - файл сообщений о состоянии аварийных сигналов, полученных от узла,
* msgerr - файл сообщений о состоянии аварийных сигналов, полученных от узла,
* msgstat - файл сообщений о состоянии аварийных сигналов, полученных от узла.
* Обновление и считывание файлов <узел: Hostname>Msgalr, <узел: Hostname>Msgerr, <узел:
* Hostname>Msgstat из узла
* Проверка аварийных сигналов в узле SN
* Проверка аварийных сигналов узла - Окно <узел: Hostname - A side> или <узел: Hostname - В side>
* Если контролируемым объектом является узел с дублированной управляющей группой, то с помощью команды Open открывается окно <узел: Hostname - A side> или <узел: Hostname - В side>, представляющее состояние аварийных сигналов определенной стороне контролируемого узла. Это представляет собой второй уровень вывода аварийных сигналов узла. В верхней части окна указано имя узла и стороны дублированной управляющей группы, состояние которой проверяется (смотри Введение).
В выбранном узле можно контролировать состояние на основании:
* текущих аварийных сигналов,
* предыдущих аварийных сигналов.
В верхней части окна находятся два цветных индикатора. Первый отображает состояние соединения с менеджером SNMP вместе с названием рабочей станции, на которой работает менеджер SNMP:
* Connecting to SNMP manager on hostname - агент SNMP устанавливает соединение - желтый цвет,
* Normal Connection to SNMP manager on hostname - агент SNMP соединен - зеленый цвет,
* No Connection to SNMP manager on hostname - агент SNMP не соединен - красный цвет.
Второй индикатор отображает состояние передачи данных:
* Requesting Data from SNMP Agent - передан запрос на передачу данных - желтый цвет,
* Transferring Data from SNMP Agent - данные передаются - желтый цвет,
* Transfer Complete - передача закончена - зеленый цвет,
* Network Link to SNMP Agent Up - необходимо обновить данные - желтый цвет,
* Network Link to SNMP Agent Down - соединение отсутствует - красный цвет,
* No Response from SNMP Agent - агент не дает ответа - красный цвет,
* Unknown SNMP Object or Generic Error - неисправный агент SNMP - красный цвет.
При отсутствии соединения прикладная программа пытается автоматически установить соединение с менеджером SNMP каждые 10 секунд:
* имя сервера: сетевое имя сервера MN, в котором работает менеджер SNMP.
FMG |
Окно Alarm monitoring Open |
Окно <узел: Hostname – A side > Или: <узел: Hostname – B side > History – Transfer History |
View Alarm Messages <узел> Msgalr |
MN |
View Error Messages <узел> Msgerr |
View Status Messages <узел> Msgstat |
В полях окна <узел: Hostname - A side> или <узел: Hostname - В side> записано:
* Alarm Status - степень срочности самого срочного аварийного сигнала:
· Urgent - на объекте имеется хотя бы один срочный аварийный сигнал или соединение TCP/IP с контролируемым объектом отсутствует,
·Semi Urgent - на объекте имеется хотя бы один полусрочный аварийный сигнал,
·Non Urgent - на объекте имеется хотя бы один несрочный аварийный сигнал,
·Normal - на объекте отсутствуют аварийные сигналы,
·Unknown - состояние объекта неизвестно (сразу же после запуска прикладной программы),
·No response - агент SNMP на объекте не дает ответа,
· Link Down - соединение TCP/IP с контролируемым объектом отсутствует.
Значение цветного фона в окне аварийных сигналов:
* красный цвет - Urgent или No response или Link Down,
* желтый цвет - Semi Urgent,
* голубой цвет - Non Urgent,
* зеленый цвет- Normal,
* белый цвет- Unknown.
* State - состояние активности стороне А или В дублированного центрального модуля:
j Unknown - состояние контролируемого узла неизвестно, j In Operation - контролируемый узел активный,
-> Cold Stand By - контролируемый узел находится в состоянии холодного резерва,
* Alarm Summary - общее количество срочных, полусрочных и несрочных аварийных сигналов:
j UA - количество срочных аварийных сигналов, j SA - количество полусрочных аварийных сигналов, j NA - количество несрочных аварийных сигналов.
В столбцах окна <узел: Hostname - A side>или <узел: Hostname - В side>записано: -
* Priority - степень срочности аварийного сигнала отображается цветом:
j красный - Urgent или No response или Link Down, j желтый - Semi Urgent, о голубой - Non Urgent,
* Board Component - идентификатор контролируемого модуля (в данный момент речь идет о блоке CDx),
* Object Identity - идентификатор контролируемого объекта,
* Object Туре - тип контролируемого объекта,
* Error Code - код ошибки,
* Error Description - описание ошибки или причина появления аварийного сигнала.
Функции строки меню в окне <узел: Hostname - A side> или <узел: Hostname - В side>
следующие:
* File - Show List - выводится целое окно, Hide List - закрывается часть окна со столбцами, Exit - выход из окна и закрытие прикладной программы,
* History - Transfer - передача трех файлов с сообщениями из узла в MN,
* History - View Error Messages- просмотр содержимого файла msgerrr,
* History - View Status Messages - просмотр содержимого файла msgstat - системные сообщения,
* History - View Alarm Messages- просмотр содержимого файла msgalr,
* ANA Alarm - Transfer- из ASM данные передаются в MN, View History- просмотр содержимого файла ANA_<y3en: Hostname - A side> - Notepadили ANA_<y3en: Hostname - В side>
(содержимое файла идентичное).
Команда Transfer History
Для передачи последних файлов, которые содержат архивные данные об аварийных сигналах, необходимо выполнить команду Transfer History в окне < узел: Hostname - A side> или <узел: Hostname - В side>. После этого команды существующим трем файлам (msgalr, msgerr, msgstat) добавляются новые файлы. Содержимое этих файлов считывается после выполнения следующих команд: View Error Messages, View Status Messagesи View Alarm Messages
• Окно View Error Messages
Форматы сообщений об ошибках и сообщений о состоянии идентичны. Заданием сообщений об ошибках и сообщений о состоянии является передача информации о типе, местонахождении, степени срочности аварийного сигнала, а также о времени появляния ошибки. Окно <узел: Hostname - A side>MsgErr.txt - Notepad или <узел: Hostname - В side>MsgErr.txt - Notepad открывается командой View Error Messages группы History в окне <узел: Hostname - А side> или <узел: Hostname • В side>. Оно предназначено для вывода архивных данных об ошибках определенной стороны узла с дублированной управляющей группой. К данным об ошибках относятся:
• [2], —, индикатор появления ошибки или индикатор снятия ошибки (количество знаков означает срочность аварийного сигнала, смотри раздел Введение),
• дата появления ошибки,
• время появления ошибки,
• <узел: Hostname - A side>или <узел: Hostname - В side>,
• Err - код ошибки,
• ОТ - тип контролируемого объекта,
• OI - идентификатор контролируемого объекта,
• описание ошибки.
Окно View Status Messages
Окно <узел: Hostname - A side>MsgStat.txt - Notepadили <узел: Hostname - В side>MsgStat.txt - Notepadоткрывается с помощью команды View Status Historyизгруппы Historyв окне <узел: Hostname - A side>или <узел: Hostname - В side>.Оно предназначено для вывода системных ошибок. К данным об ошибке относятся:
• дата появления ошибки,
• время появления ошибки,
• <узел: Hostname - A side> или <узел: Hostname - В side>,
• Err - код ошибки,
• ОТ - тип контролируемого объекта,
• OI - идентификатор контролируемого объекта,
• описание системной ошибки.
Окно View Alarm Messages
Окно <узел: Hostname - A side>MsgAlr.txt - Notepadили <узел: Hostname - В side>MsgAlr.txt - Notepadоткрывается с помощью команды View Alarm Messagesгруппы Historyв окне <узел: Hostname - A side>или <узел: Hostname - В side>.Оно предназначено для вывода архивных данных об аварийных состояниях. К данным об ошибке относятся:
• дата появления ошибки,
* время появления ошибки, <узел: Hostname - A side>или <узел: Hostname - В side>,
* UA - счетчик срочных аварийных сигналов при изменении состояния,
* SA - счетчик полусрочных аварийных сигналов при изменении состояния,
* NA - счетчик несрочных аварийных сигналов при изменении состояния.
Показ аварийных сигналов модуля ASM
Сбор аварийных сигналов в модуле ASM. Передача файлов с диагностическими сообщениями о состоянии в ASM.
Диагностика онлайн циклически выполняется в модуле ASM. Диагностические сообщения собираются в модуле ASM. Обеспечена передача данных по аварийному состоянию модуля ASM (несрочные, полусрочные и срочные аварийные сигналы с кодами: 1С, 1D, 1Е в MN (бит NFAS)). Указанные выше аварийные сигналы выводятся в окне Alarm Monitoring, в котором находятся сообщения о состоянии узла.
Содержимое файла ANA_<узел: Hostname - A side> - Notepad идентично содержимому файла ANA_<узел: Hostname - В side> - Notepad и по запросу специалиста по техническому обслуживанию можно его прочитать или сохранить.
На следующей схеме приведены указанные выше процессы:
Создание файла ANA_<узел: Hostname> - Notepad