En un mundo donde las redes e infraestructura informáticas de las empresas se hacen cada vez más importantes para el funcionamiento del negocio, una "caída de sistema" puede implicar fuertes pérdidas. Para evitarlo, se deben implementar eficientes herramientas y políticas de monitoreo de sistemas. A medida que las organizaciones aumentan su capacidad informática, no sólo comienzan a preocuparse por la seguridad, disponibilidad y escalabilidad de sus aplicaciones y hardware, sino que también necesitan controlar en todo momento lo qué esta sucediendo tanto en los equipos como en las redes corporativas, para así poder reaccionar a tiempo. Bajo este concepto nace el monitoreo de sistemas.
En términos simples, esta práctica permite verificar sistemáticamente el desempeño y la disponibilidad de los elementos críticos del equipamiento informático instalado al interior de la compañía o en un Data Center. La infraestructura de comunicaciones y los servidores de red como firewalls, proxies, servidores web y correo electrónico son algunos de los elementos vigilados constantemente por las aplicaciones de monitoreo.
Las soluciones de este tipo funcionan en base a alarmas, que se activan cuando se produce una incidencia en el servicio y notifica a las personas responsables a través de la propia consola del sistema, mediante correo electrónico o directamente a un teléfono móvil con un SMS. Además, el sistema puede realizar acciones proactivas para la resolución automática de la incidencia.
Los sistemas de monitorio se podrían dividir en dos grupos:
Monitoreo y administración de plataforma: Este sistema realiza el estudio de parámetros críticos de la plataforma, tales como disponibilidad, rendimiento, fallas y configuración, entre otros.
Monitoreo y administración de redes: Permite monitorear el estado de actividad de los equipos de comunicaciones y otros elementos de la red, incluyendo la composición del tráfico en los dispositivos de red y toma de estadísticas de la utilización de los recursos de comunicación. Además, se realiza inventario de los recursos de la red, direcciones IP y su asociación al correspondiente nombre del equipo.
Los sistemas de monitorio pueden detonar alarmas por algunas de las siguientes causas:
Identificación y registro de eventos, tales como falta de disponibilidad de un equipo o recurso y violaciones a los umbrales de operación definidos.
Identificación de degradaciones en el desempeño del sistema, los que provocan problemas o tiempos de respuesta lentos.
Incorrecto funcionamiento de los servicios de red a nivel de usuario: servidores web, servicios de correo (SMTP, POP3, IMAP, POP3s, IMAPs), etc., y también servidores como Exchange Server, SQL Server u Oracle. Fallos de discos en sistemas RAID (que degradan el servicio, pero no hay una falla total) Por problemas de rendimiento o estado general del sistema: utilización excesiva de CPU (debido a procesos colgados), particiones de disco a punto de quedarse sin espacio, etc.
Por problemas provenientes de ciertos parámetros físicos del hardware: temperatura de la CPU, estado de los ventiladores, voltajes, etc.
Además, cada cierto tiempo, los software arrojan otro tipo de avisos, que no tienen relación necesariamente con un mal funcionamiento de la actividad informática, sino con el comportamiento general de los sistemas, este es el caso por ejemplo de:
Registro de los eventos identificados (bitácora). Emisión de reportes mensuales de eventos. Conectividad de red a nivel IP
Parámetros físicos como temperatura, voltaje o el estado de los ventiladores.






