Blog sobre la Gestión de TI

En este blog encontrarás información relevante acerca de temas relacionados con las soluciones de ManageEngine y TI. Es un medio importante para estar actualizado y encontrar respuestas a preguntas frecuentes.
Tamaño de fuente: +

Las 10 Mejores prácticas para hacer frente a incidentes mayores en TI

Las 10 Mejores prácticas para hacer frente a incidentes mayores en TI

Los incidentes mayores en TI afectan a organizaciones grandes y pequeñas, sin excepción. Estos incidentes pueden ser transacciones bancarias fallidas, fallas en el sistema de venta de boletos o caídas de un servicio, lo que se traduce en un impacto negativo en los clientes. En tales circunstancias, las mesas de ayuda se llenan de llamadas que sólo aumentan el pánico y el caos.

Cuando un incidente como este sucede, el tiempo es un factor en contra para encontrar una solución, ya que cada hora podría traducirse en miles, sino millones de pesos perdidos. En algunos casos los técnicos de TI a menudo se encuentran contestando llamadas y respondiendo a mensajes de correo electrónico en lugar de tratar de encontrar una solución. ¿Qué se necesita para mantener la cabeza fría y dirigir una empresa en esta situación? Sigue estas 10 mejores prácticas para hacer frente a sucesos importantes que vienen en camino.

  1. Defina claramente ¿qué es realmente un incidente mayor?

Cuando un problema hace un gran impacto en la empresa se puede categorizar como un incidente mayor. Por lo general, los incidentes de alta prioridad se consideran incidentes mayores equivocadamente. Esto sucede debido a la ausencia de guías de ITIL claras. Por lo tanto, para evitar cualquier confusión, se debe definir un “incidente mayor” a través de varios factores tales como la urgencia, el impacto y la gravedad.

  1. Tenga flujos de Trabajo

La implementación de un flujo de trabajo te ayuda a restaurar un servicio interrumpido rápidamente. Los flujos de trabajo específicos para incidentes mayores ayudan en la resolución sin contratiempos. Se deberá de centrar en:

  • La identificación de incidentes mayores.
  • Comunicar a las partes afectadas (stakeholders)
  • Asignación de las personas adecuadas
  • Seguimiento de los incidentes mayores a lo largo del ciclo de vida
  • Escalación al vencimiento deSLA´s
  • Resolución y cierre
  • Generación y análisis de los informes
  1. Asigne lostécnicos adecuados

Asegúrese de que sus mejores técnicos estén trabajando en los incidentes mayores. Es importante definir claramente sus funciones y responsabilidades, debido al alto impacto que estos incidentes tienen en el negocio. Algunas organizaciones tienen un equipo dedicado a incidentes mayores encabezados por un Gerente de incidentes Mayores, mientras que otros tienen un equipo dinámico que cuenta con expertos de varios departamentos. Su principal objetivo debe ser mantener sus recursos dedicados y evitar conflictos de tiempo y prioridades.

  1. Capacite a su personal y equípelos con las herramientas adecuadas

Realmente no es posible saber cuándo un incidente mayor va afectar a su empresa, pero el primer paso para manejarlo, es estar preparado. Divida su equipo para incidentes mayores en equipos secundarios y capacítelos en el manejo de incidentes. Asigne responsabilidades mapeando habilidades con requerimientos. Ejecute pruebas de simulación de forma regular para identificar las fortalezas, evaluar el desempeño y llenar los vacíos según sea necesario. Esto también ayudará a su equipo para afrontar el estrés y estar preparado cuando se enfrenten a escenarios en tiempo real. Dote a su equipo con las herramientas adecuadas, tales como teléfonos inteligentes y tablets con conectividad para que puedan trabajar desde cualquier lugar durante una emergencia.

  1. Configure losSLAs en escalaciones jerárquicas

Define los SLAsestrictos para los incidentes mayores. Configure los SLAs de respuesta y resolución separados con puntos claros de escalamiento por cualquier incumplimiento del proceso. Además, si el técnico asignado carece de la experiencia necesaria para resolver el incidente, sigue un proceso de escalamiento manual. Asegúrese de que un técnico de respaldo siempre esté disponible.

  1. Mantén a los involucrados informados

A lo largo de los incidentes mayores, es bueno tener la atención de enviar notificaciones o actualizaciones del estado a las partes interesadas o afectadas. Anuncios en el portal de autoservicio evitarán que los usuarios finales generen tickets duplicados. También envíe actualizaciones por hora o dos veces por hora durante el tiempo de inactividad del servicio. Ten una línea dedicada para responder inmediatamente a los incidentes mayores y así ofrecer apoyo a las partes afectadas. Utiliza el medio más rápido de comunicación, tales como llamadas telefónicas o chat en línea

  1. Relacione incidentes mayores con otros procesos ITIL

 

Después de que se resuelva un incidente mayor, realice un análisis de causa raíz mediante el uso de métodos de gestión de problemas. Después aplique los cambios a nivel global para prevenir incidentes similares en el futuro, no se olvide de seguir el proceso de gestión del cambio. Acelere los procesos de incidentes, problemas y cambios, proporcionando información detallada sobre los activos involucrados mediante el uso de la gestión de activos (CMDB).

  1. Mejore su base de conocimientos

Formule plantillas simples predeterminadas para los artículos de la base de conocimiento que contenga datos críticos tales como, el último problema resuelto mediante el artículo, Autor del artículo, y los recursos que serían necesarios para implementar la solución. La creación y seguimiento de soluciones debe ser rápida y sin esfuerzo.

  1. Revise y genere informes sobre incidentes mayores

Documente y analice los incidentes mayores de manera que pueda identificar las áreas de mejora. Esto ayudará a su equipo a manejar de manera eficiente problemas similares en el futuro. Además, generará importantes informes para el análisis, la evaluación y toma de decisiones. Podrá generar los siguientes informes:

  • Número de incidentes mayores levantados y cerrados cada mes.
  • Tiempo medio de resolución de incidentes mayores.
  • Porcentaje de no disponibilidad en un servicio causado por incidentes mayores.
  • Los problemas y los cambios vinculados a los incidentes mayores.
  1. Documente el proceso de Incidentes Mayores para una mejora continua

Es una buena práctica documentar los principales procesos de incidentes y flujos de trabajo para una pronta referencia. Esto podría contener detalles como el número de personas involucradas, sus funciones y responsabilidades, canales de comunicación, herramientas utilizadas para la revisión, aprobación y flujos de trabajo de escalamiento. También es importante reportar la estrategia general junto con las métricas para el tiempo de respuesta y resolución. La alta dirección debe evaluar los procesos de forma regular para comprobar si se cumplen los niveles de rendimiento deseado. Esto puede ayudar a corregir defectos y servir para la mejora continua del servicio.

Los incidentes mayores son inevitables y cada uno es una experiencia de aprendizaje para usted y su  equipo. La interpretación y el aprendizaje de estas prácticas podría ser el primer paso para dominar los incidentes mayores.

¿Cansado de ataques informáticos?
Monitoreo y Auditoría de Usuarios Privilegiados

Artículos relacionados

Suscríbete al Blog