En este artículo desarrollamos diferentes formas de desplegar una estrategia de gestión de servicios de TI, que en función de las características de nuestro negocio, su tamaño, el grado de criticidad y el grado de madurez de nuestra organización, se implementarán de forma parcial o total o combinada en fases secuenciales o paralelas. También tendremos en cuenta no solo los aspectos relacionados con el despliegue sino también con el mantenimiento de la propia solución de gestión, que es sin duda una de las mayores componentes de coste de la solución global. Antes de seguir aclaramos los conceptos sobre los que está basado este artículo.
Para el tema que nos ocupa, entiendemos la gestión de TI como el proceso que permite conocer el estado de la infraestructura de comunicaciones, sistemas y aplicaciones de tal forma que podamos conocer el estado de los servicios que soportan el negocio.
A la hora de acometer un proyecto de gestión de TI que parte desde un nivel de madurez bajo, la estrategia más recomendable es la que desarrollamos en la siguientes líneas.
1. Implementar mecanismos que permitan obtener la percepción de usuario.
Permite obtener un gran beneficio a un coste reducido. Este tipo de mecanismos están basados en el uso de sondas o robots que simulan las peticiones de un usuario a un servicio típicamente basado en Web, que cubren la mayor parte de los servicios de TI actuales. En función de la solución elegida, también es posible utilizar otros protocolos para monitorizar otro tipo de servicios.
Este método de gestión permite obtener de una forma muy rápida resultados del funcionamiento de nuestros servicios críticos, dando incluso información adicional del origen de las incidencias.
Su coste es bastante reducido puesto que su implementación es muy rápida. Como inconveniente, este tipo de herramientas no nos aportan información suficiente para realizar el troubleshooting o el diagnóstico de las incidencias en el servicio. Por lo tanto, serán necesarios otros medios complementarios para facilitar la resolución de las incidencias desde un punto de vista más técnico.
En cuanto al mantenimiento de la solución de gestión, este tipo de soluciones presentan un coste bastante bajo de mantenimiento por lo que podemos decir que su relación coste-beneficio global es óptima.
2. Implementar mecanismos de captura de tráfico.
Este tipo de técnicas están basadas en la captura de las tramas que circulan por nuestras redes, de tal forma que mediante el análisis de las mismas se obtengan datos relativos a los protocolos, aplicaciones, estaciones origen y destino y problemas de funcionamiento. En este caso se implementa sobre un appliance HW y/o SW un mecanismo de captura de información de la red que es analizada por el SW experto para obtener la información mencionada.
Para que este tipo de técnicas sean eficientes, es necesario elegir muy bien los puntos en los que se capturará el tráfico dentro de nuestra red y definir cual será el tiempo que queremos almacenar para poder analizar un periodo conflictivo en busca de problemas o incidencias. También será necesario determinar los mecanismos en los que se basará nuestra captura, como Netflow, port-mirroring, etc.
La ventaja que tiene este tipo de técnicas es que tiene una relación coste beneficio media-alta y que su despliegue es relativamente rápido. También puede ayudarnos a detectar problemas ocultos en nuestra red, como puede ser un broadcast elevado o algún tráfico sospechoso omo virus o gusanos.
Como inconveniente, requiere un estudio de cierto nivel de detalle que permita identificar los puntos más estratégicos de nuestra red por los que pasa un porcentaje elevado de nuestro tráfico. En función del equipamiento de red en el que se soporte nuestra infraestructura, el mecanismo de captura será de un tipo u otro, pero en cualquier caso es importante asegurar que el rendimiento de la red se mantiene a la hora de capturar el tráfico.
En cuanto al mantenimiento de la solución de gestión, este tipo de técnicas presentan un coste moderado, siendo en este caso necesaria la cualificación del personal que opera el sistema y un coste de mantenimiento del HW/SW que permita mantener actualizado el sistema para incoroporar nuevos protocolos y aplicaciones y gestionar las propias averías del equipamiento HW.
3. Gestión integral de la infraestructura.
Por último, el tercer método de gestionar Servicios de TI es el que parte desde la gestión de las infraestructuras desde un punto de vista técnico de "bajo" nivel (muy detallado). Esto requiere el despliegue de plataformas de gestión que recogen la información que le reportan los equipos que forman parte de la infraestructura de comunicaciones y sistemas mediante protocolos tipo SNMP.
Si bien este sistema es el más completo y potente porque es capaz de proporcionar información detallada del funcionamiento de los servicios y de los elementos exactos que fallan y su causa, su implementación requiere un minucioso plan de despliegue y un largo proceso de implementación y modelado.
Cuando los equipos se ponen en funcionamiento, es necesario configurar cual será el destino de la información de gestión. Una vez recogida, dicha información, debe tratarse para que los múltiples mensajes que se reciben por el sistema de gestión sean realmente relevantes para los servicios. Para ello se implementan otras aplicaciones que permiten correlar las diferentes alarmas enviadas por los distintos equipos a su plataforma de gestión y reportar a los niveles superiores (de servicio) eventos de mayor categoría.
La ventaja que presentan estos sistemas es que para redes complejas con muchos nodos, son la forma de realizar un rápido troubleshooting que de otra forma se alargaría en el tiempo con la consiguiente penalización del servicio. Son sistemas escalables que permiten crecer de forma paralela a la infraestructura.
Por contra, presentan el inconveniente de requerir conocimentos específicos tanto para su administración como para su operación. Requieren un proceso largo (y por tanto costoso) de implementación y de despliegue.
En cuanto a su mantenimiento, estamos hablando de soluciones costosas que requieren tanto un mantenimiento HW como del SW proporcional al número de nodos.
Conclusiones
La estrategia a implementar dependerá de nuestro negocio. Si el tamaño es pequeño y nuestro presupuesto es ajustado la estrategia 1 podrá ser suficiente para conocer el estado de nuestro servicio. En cualquier caso, la estrategia 1 permite conocer el funcionamiento del servicio desde el punto de vista de usuario.
A medida de que el tamaño de nuestra infraestructura aumente será necesario contar con información adicional que permita mejorar el grado de comprensión de nuestro servicio desde el punto de vista técnico. Desde este punto ve vista, complementando la estrategia 1 con la 2, seremos capaces de mejorar nuestro troubleshooting y facilitar la solución de las incidencias desde el punto de vista técnico.
Por último, cuando el tamaño de nuestra infraestructura y la criticidad de nuestro servicio sea alta, no tendremos suficiente control sobre nuestros servicios si no es implementando la estrategia 3, que nos permitirá actuar de forma rápida y precisa ante cualquier incidencia sobre la infraestructura técnica que afecte a nuestros servicios.
No existe una estrategia única sino una precisa combinación de ellas. Dependerá de nuestras circunstancias y de algo que suele ser importante: el presupuesto y los recursos con los que contemos.
Interesante articulo, me pregunto cuál es la situación actual en cuanto a gestión de servicios de TI en las diferentes administraciones, incluida la Comunidad de Madrid.
ResponderEliminarSoy Manuel Pereira de ICM, veo que hace poco que has empezado con tu blog, te animo a que sigas con ello. Aunque al principio haya pocas visitas, siendo constante al final tener seguidores habituales resulta muy gratificante.
Yo empecé con el mio sobre ciencia, tecnología y administración pública hace menos de un año y estoy muy contento con los resultados.
Un saludo.