SCOM (partofMicrosoftSystemCenter)
ResourceMonitor
Великолепный инструмент, позволяющий оценить использование процессора, оперативной памяти, сети и дисков в Windows. Он позволяет быстро получить всю необходимую информацию о состоянии критически важных серверов.
ResourceMonitor
PerformanceMonitor
Основной инструмент для управления счетчиками производительности в Windows. PerformanceMonitor, в более ранних версиях Windows известен нам как Системный монитор. Утилита имеет несколько режимов отображения, выводит показания счетчиков производительности в режиме реального времени, сохраняет данные в лог-файлы для последующего изучения.
PerformanceMonitor
Reliability Monitor
ReliabilityMonitor — Монитор стабильности системы, позволяет отслеживать любые изменения в производительности компьютера, найти монитор стабильности можно в Windows 7, в Windows 8: ControlPanel>SystemandSecurity>ActionCenter. С помощью ReliabilityMonitor можно вести учет изменений и сбоев на компьютере, данные будут выводиться в удобном графическом виде, что позволит Вам отследить, какое приложение и когда вызвало ошибку или зависло, отследить появление синего экрана смерти Windows, причину его появления (очередное обновлением Windows или установка программы).
ReliabilityMonitor
MicrosoftSysInternals
SysInternals — это полный набор программ для администрирования и мониторинга компьютеров под управлением ОС Windows. Вы можете скачать их себе бесплатно на сайте Microsoft. Сервисные программы Sysinternals помогают управлять, находить и устранять неисправности, выполнять диагностику приложений и операционных систем Windows.
SysInternals
SCOM (partofMicrosoftSystemCenter)
SystemCenter — представляет собой полный набор инструментов для управления IT-инфраструктурой, c помощью которых Вы сможете управлять, развертывать, мониторить, производить настройку программного обеспечения Microsoft (Windows, IIS, SQLServer, Exchange, и так далее). Увы, MSC не является бесплатным. SCOM используется для проактивного мониторинга ключевых объектов IT-инфраструктуры.
SCOM
Мониторинг Windows серверов с помощью семейства Nagios
Nagios
Nagios является самым популярным инструментом мониторинга инфраструктуры в течение нескольких лет (для Linux и Windows). Если Вы рассматриваете Nagios для Windows, то установите и настройте агент NSClient ++ на Windows сервер. NSClient ++ мониторит систему в реальном времени и предоставляет выводы с удаленного сервера мониторинга и не только.
Nagios
Cacti
Обычно используется вместе с Nagios, предоставляет пользователю удобный веб-интерфейс к утилите RRDTool, предназначенной для работы с круговыми базами данных (RoundRobinDatabase), которые используются для хранения информации об изменении одной или нескольких величин за определенный промежуток времени. Статистика всетевых устройств, представлена в виде дерева, структура которого задается самим пользователем, можно строить график использования канала, использования разделов HDD, отображать латентость ресурсов и т.д.
Cacti
Shinken
Гибкая, масштабируемая система мониторинга с открытым исходным кодом, основанная на ядре Nagios, написанном на Python. Она в 5 раз быстрее чем Nagios. Shinkenсовместима с Nagios, возможно использование ее плагинов и конфигураций без внесения коррективов или дополнительной настройки.
Shinken
Icinga
Еще одна популярная открытая система мониторинга, которая проверяет хосты и сервисы и сообщает администратору их состояние. Являясь ответвлением Nagios, Icingaсовместима с ней и у них много общего.
OpsView
OpsView изначально был бесплатен. Сейчас, увы, пользователям данной системой мониторинга приходится раскошеливаться.
OpsView
Op5
Op5 еще одна система мониторинга с открытым исходным кодом. Построение графиков, хранение и сбор данных.
Op5
Альтернативы Nagios
13. Zabbix
Открытое программное обеспечение для мониторинга и отслеживания статусов разнообразных сервисов компьютерной сети, серверов и сетевого оборудования, используется для получения данных о нагрузке процессора, использования сети, дисковом пространстве и тому подобного.
Zabbix
Munin
Неплохая система мониторинга, собирает данные с нескольких серверов одновременно и отображает все в виде графиков, с помощью которых можно отслеживать все прошедшие события на сервере.
Munin
Zenoss
Написан на языке Python с использованием сервера приложений Zope, данные хранятся в MySQL. С помощью Zenoss можно
мониторить сетевые сервисы, системные ресурсы, производительность устройств, ядро Zenoss анализирует среду. Это дает возможность быстро разобраться с большим количеством специфических устройств.
Zenoss
Observium
Система мониторинга и наблюдения за сетевыми устройствами и серверами, правда список поддерживаемых устройств огромен и не ограничивается только сетевыми устройствами, устройство должно поддерживать работу SNMP.
Observium
Centreon
Комплексная система мониторинга, позволяет контролировать всю инфраструктуру и приложения, содержащие системную информацию. Бесплатная альтернатива Nagios.
Centreon
Ganglia
Ganglia — масштабируемая распределенная система мониторинга, используется в высокопроизводительных вычислительных системах, таких как кластеры и сетки. Отслеживает статистику и историю вычислений в реальном времени для каждого из наблюдаемых узлов.
Ganglia
Pandora FMS
Система мониторинга, неплохая продуктивность и масштабируемость, один сервер мониторинга может контролировать работу нескольких тысяч хостов.
Pandora FMS
NetXMS
Программное обеспечение с открытым кодом для мониторинга компьютерных систем и сетей.
NetXMS
OpenNMS
OpenNMS платформа мониторинга. В отличие от Nagios, поддерживает SNMP, WMI и JMX.
OpenNMS
HypericHQ
Компонент пакета VMwarevRealizeOperations, используется для мониторинга ОС, промежуточного ПО и приложений в физических, виртуальных и облачных средах. Отображает доступность, производительность, использование, события, записи журналов и изменений на каждом уровне стека виртуализации (от гипервизора vSphere до гостевых ОС).
HypericHQ
Bosun
Система мониторинга и оповещения (alertsystem) с открытым кодом от StackExchange. В Bosun продуманная схема данных, а также мощный язык их обработки.
Bosun
Sensu
Sensu система оповещения с открытым исходным кодом, похожа на Nagios. Имеется простенький dashboard, можно увидеть список клиентов, проверок и сработавших алертов. Фреймворк обеспечивает механизмы, которые нужны для сбора и накопления статистики работы серверов. На каждом сервере запускается агент (клиент) Sensu, использующий набор скриптов для проверки работоспособности сервисов, их состояния и сбора любой другой информации.
Sensu
CollectM
CollectM собирает статистику об использовании ресурсов системы каждые 10 секунд. Может собирать статистику для нескольких хостов и отсылать ее на сервер, информация выводится с помощью графиков.
CollectM
PerfTrap
PerfTrap собирает метрики с серверов, и с помощью Graphite производится визуализация собранных данных.
WMIagent
Если Вы фанат Python, WMIagent для Вас.
PolyMon
PolyMon является инструментом мониторинга системы с открытым исходным кодом, на .NET Framework 2.0 и SQL Server 2005.
CloudNinjaMeteringBlock
CloudNinjaMeteringBlock производит анализ производительности и автоматическое масштабирование мультитенантных приложений в WindowsAzure. Такой анализ включает в себя не только определение или проверку счетов за использование ресурсов от WindowsAzure, но и оптимизацию ресурсов.
Enigma
Enigma — красивое приложение, которое поможет Вам следить за всеми важных показателями прямо с рабочего стола.
Платные решения
32. SSC Serv
SSC Serv платный инструмент мониторинга.
KS-HostMonitor
Инструменты для мониторинга сетевых ресурсов, позволяет проверять любые параметры серверов, гибкие профили действия позволяют действовать в зависимости от результатов тестов.
KS-HostMonitor
TotalNetworkMonitor
Это программа для постоянного наблюдения за работой локальной сети отдельных компьютеров, сетевых и системных служб. TotalNetworkMonitor формирует отчет и оповещает Вас о произошедших ошибках. Вы можете проверить любой аспект работы службы, сервера или файловой системы: FTP, POP/SMTP, HTTP, IMAP, Registry, EventLog, ServiceState и других.
TotalNetworkMonitor
PRTG
PRTG — простая в использовании, условно-бесплатная программа для мониторинга сети, собирает различные статистические данные с компьютеров, программ и устройств, которые Вы указываете, поддерживает множество протоколов для сбора указанных сведений, таких как SNMP и WMI.
GroundWork
GroundWork, по сравнению с Nagios или Cacti, не требует значительных затрат времени для настройки. Для управления и вывода информации используется понятный веб-интерфейс, который построен на базе Monarch (MONitorARCHitecture)и Fruity. Если возникает проблема, на указанный почтовый адрес приходит сообщение или SMS-сообщение. Предоставляемая система отчетов позволяет проанализировать все процессы во времени.
WhatsUpGold
Это мощное, простое в использовании программное средство для комплексного мониторинга приложений, сети и систем. Позволяет производить поиск и устранение проблем до того, как они повлияют на работу пользователей.
WhatsUpGold
Idera
Поддерживает несколько операционных систем и технологий виртуализации. Есть много бесплатных тулзов, с помощью которых можно мониторить систему.
Windows Health Check
Windows Capacity Check
Windows Process Heat Map
Idera
PowerAdmin
PowerAdmin является коммерческим решением для мониторинга.
PowerAdmin
ELM EnterpriseManager
ELM EnterpriseManager — полный мониторинг от «что случилось» до «что происходит» в режиме реального времени. Инструментымониторингав ELM включают — Event Collector, Performance Monitor, Service Monitor, Process Monitor, File Monitor, PING Monitor.
ELM EnterpriseManager
EventsEntry
EventsEntry
Veeam ONE
Эффективное решение для мониторинга, создания отчетов и планирования ресурсов в среде VMware, Hyper-V и инфраструктуре VeeamBackup&Replication, контролирует состояние IT-инфраструктуры и диагностирует проблемы до того, как они помешают работе пользователей.
Veeam ONE
HP OperationsManager
Это программное обеспечение для мониторинга инфраструктуры, выполняет превентивный анализ первопричин, позволяет сократить время на восстановление и расходы на управление операциями. Решение идеально для автоматизированного мониторинга.
HP OperationsManager
DellOpenManage
OpenManage (теперь DellEnterpriseSystemsManagement) «все-в-одном продукт» для мониторинга.
HalcyonWindowsServerManager
HalcyonWindowsServerManager
TopperPerfmon
Используется для мониторинга серверов, контролирует процессы, их производительность.
TopperPerfmon
BMC Patrol
Система мониторинга и управления управления IT — инфраструктурой.
Patrol
Max Management
Max Management
ScienceLogic
ScienceLogic ещеоднасистемамониторинга.
VeraX
Менеджмент и мониторинг сетей, приложений и инфраструктуры.
VeraX
Ниже приведен список (наиболее популярных) инструментов для мониторинга сети
54. Ntop
Ntop
NeDi
Nedi является инструментом мониторинга сети с открытым исходным кодом.
NeDi
TheDude
Система мониторинга Dude, хоть и бесплатна, но по мнению специалистов, ни в чем не уступает коммерческим продуктам, мониторит отдельные серверы, сети и сетевые сервисы.
TheDude
BandwidthD
Программа с открытым исходным кодом.
BandwidthD
NagVis
Расширение для Nagios, позволяет создавать карты инфраструктуры и отображать их статус. NagVis поддерживает большое количество различных виджетов, наборов иконок.
NagVis
ProcNetMonitor
Бесплатное приложение для мониторинга, позволяет отследить все активные процессы и при необходимости быстро остановить их, чтобы снизить нагрузку на процессор.
ProcNetMonitor
PingPlotter
Используется для диагностики IP-сетей, позволяет определить, где происходят потери и задержки сетевых пакетов.
PingPlotter
Маленькие, но полезные инструменты
Список не был бы полным без упоминания нескольких вариантов аппаратного мониторинга.
IPMIutil
IPMIutil
RealTemp
Утилита для мониторинга температур процессоров Intel, она не требует инсталляции, отслеживает текущие, минимальные и максимальные значения температур для каждого ядра и старт троттлинга.
RealTemp
SpeedFan
Утилита, которая позволяет контролировать температуру и скорости вращения вентиляторов в системе, следит за показателями датчиков материнской платы, видеокарты и жестких дисков.
SpeedFan
OpenHardwareMonitor
OpenHardwareMonitor
Виды ТО (по периодичности):
регламентированное;
периодическое;
с периодическим контролем;
с непрерывным контролем.
Подробное описание профилактических работ дается в инструкции по эксплуатации отдельных устройств, прилагаемых изготовителем.
Профилактический контроль осуществляется аппаратурным и программным путями. Аппаратурный контроль проводится с помощью специальной аппаратуры, контрольноизмерительных приборов и стендов и программноаппаратных комплексов. Программный контроль требует наличие и применение различных тестирующих средств (ПО). Наиболее эффективным следует считать программно-аппаратурный контроль при наличии в ВТ развитой системы аппаратурного контроля.
Методы технического обслуживания (сервиса) по признакам организационных мероприятий и комплексу технологических операций подразделяются на:фирменный; автономный; специализированный; комбинированный.
По характеру выполнения методы ТО подразделяются на: индивидуальное; групповое; централизованное. Централизованное ТО является более прогрессивной формой обслуживания ВТ и представляет собой сеть региональных центров обслуживания и их филиалов пунктов технического обслуживания.
Системы автоматизированного контроля Контроль это проверка правильности работы объекта (элемента, узла, устройства). Правильно или нет работает устройство схема контроля выдает сигнал.
Система обнаружения ошибок (система автоматического контроля и диагностики) Процесс диагноза можно разделить на элементарные проверки Элементарная проверка состоит в подаче на объект тестового воздействия и в измерении (оценке) ответа объекта на это воздействие. Диагностика это последовательный контроль, направленный на отыскание неисправного элемента в диагностируемом объекте.
Алгоритм системы обнаружения ошибок (система автоматического контроля и диагностики) Сигнал ошибки Распознавание (диагностирование) характера ошибки (сбой, отказ) Повторный пуск программы (операции), если ошибка вызвана сбоем Локализация места неисправности, если ошибка вызвана отказом, с последующим ее устранением, путем замены (или отключения) вышедшего из строя элемента
Итак, основные виды контроля: программный; аппаратный. Режимы использования контроля: оперативный (в процессе работы ПК) профилактическая проверка автоматический или с привлечением оператора.
Программный контроль основан на использовании специальных программ, контролирующих работу ПК. Он подразделяется на: программно-логический и тестовый
Программно-логический контроль основан на том, что в основную рабочую программу вводятся дополнительные операции, при выполнении которых получается избыточная информация, необходимая для обнаружения и исправления ошибок. Он не требует применения специальной аппаратуры, однако приводит к увеличению времени решения задачи.
Тестовый контроль предназначен для проверки правильности работы ПК с помощью специальных программ тестов. Контроль с помощью тестов сводится к выполнению машиной определенных действий над исходными числами и сравнению результатов с известными. В случае несовпадения ответов фиксируется ошибка.
Тесты ПК подразделяются на: наладочные, проверочные, диагностические.
Аппаратные средства контроля - создаются введением в ПК специального контрольного оборудования (работающего независимо от программы и ОС, и не снижающего быстродействие). Однако: приводит к усложнению и удорожанию и снижению общей надежности.
Современный комбинированный метод контроля представляет собой сочетание программных и аппаратных средств.
ResourceMonitor
Великолепный инструмент, позволяющий оценить использование процессора, оперативной памяти, сети и дисков в Windows. Он позволяет быстро получить всю необходимую информацию о состоянии критически важных серверов.
ResourceMonitor
PerformanceMonitor
Основной инструмент для управления счетчиками производительности в Windows. PerformanceMonitor, в более ранних версиях Windows известен нам как Системный монитор. Утилита имеет несколько режимов отображения, выводит показания счетчиков производительности в режиме реального времени, сохраняет данные в лог-файлы для последующего изучения.
PerformanceMonitor
Reliability Monitor
ReliabilityMonitor — Монитор стабильности системы, позволяет отслеживать любые изменения в производительности компьютера, найти монитор стабильности можно в Windows 7, в Windows 8: ControlPanel>SystemandSecurity>ActionCenter. С помощью ReliabilityMonitor можно вести учет изменений и сбоев на компьютере, данные будут выводиться в удобном графическом виде, что позволит Вам отследить, какое приложение и когда вызвало ошибку или зависло, отследить появление синего экрана смерти Windows, причину его появления (очередное обновлением Windows или установка программы).
ReliabilityMonitor
MicrosoftSysInternals
SysInternals — это полный набор программ для администрирования и мониторинга компьютеров под управлением ОС Windows. Вы можете скачать их себе бесплатно на сайте Microsoft. Сервисные программы Sysinternals помогают управлять, находить и устранять неисправности, выполнять диагностику приложений и операционных систем Windows.
SysInternals
SCOM (partofMicrosoftSystemCenter)
SystemCenter — представляет собой полный набор инструментов для управления IT-инфраструктурой, c помощью которых Вы сможете управлять, развертывать, мониторить, производить настройку программного обеспечения Microsoft (Windows, IIS, SQLServer, Exchange, и так далее). Увы, MSC не является бесплатным. SCOM используется для проактивного мониторинга ключевых объектов IT-инфраструктуры.
SCOM
Мониторинг Windows серверов с помощью семейства Nagios
Nagios
Nagios является самым популярным инструментом мониторинга инфраструктуры в течение нескольких лет (для Linux и Windows). Если Вы рассматриваете Nagios для Windows, то установите и настройте агент NSClient ++ на Windows сервер. NSClient ++ мониторит систему в реальном времени и предоставляет выводы с удаленного сервера мониторинга и не только.
Nagios
Cacti
Обычно используется вместе с Nagios, предоставляет пользователю удобный веб-интерфейс к утилите RRDTool, предназначенной для работы с круговыми базами данных (RoundRobinDatabase), которые используются для хранения информации об изменении одной или нескольких величин за определенный промежуток времени. Статистика всетевых устройств, представлена в виде дерева, структура которого задается самим пользователем, можно строить график использования канала, использования разделов HDD, отображать латентость ресурсов и т.д.
Cacti
Shinken
Гибкая, масштабируемая система мониторинга с открытым исходным кодом, основанная на ядре Nagios, написанном на Python. Она в 5 раз быстрее чем Nagios. Shinkenсовместима с Nagios, возможно использование ее плагинов и конфигураций без внесения коррективов или дополнительной настройки.
Shinken
Icinga
Еще одна популярная открытая система мониторинга, которая проверяет хосты и сервисы и сообщает администратору их состояние. Являясь ответвлением Nagios, Icingaсовместима с ней и у них много общего.
OpsView
OpsView изначально был бесплатен. Сейчас, увы, пользователям данной системой мониторинга приходится раскошеливаться.
OpsView
Op5
Op5 еще одна система мониторинга с открытым исходным кодом. Построение графиков, хранение и сбор данных.
Op5
Альтернативы Nagios
13. Zabbix
Открытое программное обеспечение для мониторинга и отслеживания статусов разнообразных сервисов компьютерной сети, серверов и сетевого оборудования, используется для получения данных о нагрузке процессора, использования сети, дисковом пространстве и тому подобного.
Zabbix
Munin
Неплохая система мониторинга, собирает данные с нескольких серверов одновременно и отображает все в виде графиков, с помощью которых можно отслеживать все прошедшие события на сервере.
Munin
Zenoss
Написан на языке Python с использованием сервера приложений Zope, данные хранятся в MySQL. С помощью Zenoss можно
мониторить сетевые сервисы, системные ресурсы, производительность устройств, ядро Zenoss анализирует среду. Это дает возможность быстро разобраться с большим количеством специфических устройств.
Zenoss
Observium
Система мониторинга и наблюдения за сетевыми устройствами и серверами, правда список поддерживаемых устройств огромен и не ограничивается только сетевыми устройствами, устройство должно поддерживать работу SNMP.
Observium
Centreon
Комплексная система мониторинга, позволяет контролировать всю инфраструктуру и приложения, содержащие системную информацию. Бесплатная альтернатива Nagios.
Centreon
Ganglia
Ganglia — масштабируемая распределенная система мониторинга, используется в высокопроизводительных вычислительных системах, таких как кластеры и сетки. Отслеживает статистику и историю вычислений в реальном времени для каждого из наблюдаемых узлов.
Ganglia
Pandora FMS
Система мониторинга, неплохая продуктивность и масштабируемость, один сервер мониторинга может контролировать работу нескольких тысяч хостов.
Pandora FMS
NetXMS
Программное обеспечение с открытым кодом для мониторинга компьютерных систем и сетей.
NetXMS
OpenNMS
OpenNMS платформа мониторинга. В отличие от Nagios, поддерживает SNMP, WMI и JMX.
OpenNMS
HypericHQ
Компонент пакета VMwarevRealizeOperations, используется для мониторинга ОС, промежуточного ПО и приложений в физических, виртуальных и облачных средах. Отображает доступность, производительность, использование, события, записи журналов и изменений на каждом уровне стека виртуализации (от гипервизора vSphere до гостевых ОС).
HypericHQ
Bosun
Система мониторинга и оповещения (alertsystem) с открытым кодом от StackExchange. В Bosun продуманная схема данных, а также мощный язык их обработки.
Bosun
Sensu
Sensu система оповещения с открытым исходным кодом, похожа на Nagios. Имеется простенький dashboard, можно увидеть список клиентов, проверок и сработавших алертов. Фреймворк обеспечивает механизмы, которые нужны для сбора и накопления статистики работы серверов. На каждом сервере запускается агент (клиент) Sensu, использующий набор скриптов для проверки работоспособности сервисов, их состояния и сбора любой другой информации.
Sensu
CollectM
CollectM собирает статистику об использовании ресурсов системы каждые 10 секунд. Может собирать статистику для нескольких хостов и отсылать ее на сервер, информация выводится с помощью графиков.
CollectM
PerfTrap
PerfTrap собирает метрики с серверов, и с помощью Graphite производится визуализация собранных данных.
WMIagent
Если Вы фанат Python, WMIagent для Вас.