La monitorización de sistemas nos permite obtener una visión clara e inmediata de la situación global de un sistema informático, lo que incluye tanto el cpd, servidores y networking como los servicios a los que da soporte.
El objetivo de la monitorización es doble: por un lado, el análisis de la información obtenida de múltiples fuentes y, por otro, la generación de alertas cuando algo funciona fuera de lo esperado. Y es deseable que esto lo haga con el mínimo ruido posible: presentando sólo la información relevante y enviado solo las alertas reales a las personas involucradas en el incidente.
La monitorización ha de controlar tanto el entorno físico como lógico. Del entorno físico debemos obtener control preciso tanto del CPD (y de las delegaciones que se precise) de temperatura y control energético de la sala, situación del hardware de servidores y networking y el control de acceso. Del entorno lógico hemos de conocer la situación y el rendimiento de los servicios que presta, independientemente de la plataforma sobre la que está funcionando.
Ejemplos de lo que controlamos con la monitorización:
· Si la temperatura del CPD pasa de unos valores
· Si se ha ido la electricidad y el SAI ha saltado
· Si se ha producido un acceso no autorizado a la sala del CPD
· Si no hay conexión a internet (enviando un SMS)
· Si un servidor tiene un problema de hardware (discos en RAID por ejemplo)
· Si un servidor se ha parado o tiene un problema de red
· Si un servidor está consumiendo más CPU o memoria de la esperada
· Si un servicio de un servidor propio (una aplicación o una base de datos) no está funcionando como se espera
· Si un servicio externo no funciona (una web o un webservice)
· Si un trabajo de backup no ha acabado correctamente
· Si una impresora tiene un nivel de toner bajo
Comments