Gestión de incidentes y continuidad del negocio

ISMS Copilot ha establecido procedimientos de gestión de incidentes y continuidad del negocio para garantizar la rápida detección, contención y recuperación ante incidentes de seguridad o interrupciones del servicio. Nuestro enfoque prioriza la protección de los datos de los clientes y la disponibilidad del servicio.

La respuesta a incidentes está integrada con nuestro proceso de gestión de cambios y procedimientos de escalamiento para garantizar una respuesta coordinada.

Proceso de respuesta a incidentes

Nuestra gestión de incidentes sigue un enfoque de cinco fases:

Detección — Los sistemas de monitoreo, los informes de clientes o los escaneos de seguridad identifican posibles incidentes
Evaluación — Se evalúa la gravedad y el alcance del incidente para determinar el nivel de respuesta
Contención — Acciones inmediatas tomadas para limitar el impacto y prevenir la propagación
Recuperación — Los sistemas se restauran a su funcionamiento normal con las correcciones implementadas
Revisión posterior al incidente — Se realiza un análisis de causa raíz y se implementan medidas preventivas

Funciones y responsabilidades

Nuestro equipo de respuesta a incidentes incluye funciones definidas:

Comandante del incidente — El CEO lidera la coordinación general de la respuesta y la comunicación con las partes interesadas
Personal de guardia primario y secundario — Personal técnico de respuesta disponible para una evaluación y remediación rápidas
Líder de comunicación — Gestiona las notificaciones a los clientes y las actualizaciones de estado

Para incidentes de seguridad que involucren datos de clientes o implicaciones de cumplimiento, escalamos a la dirección de inmediato.

Procedimientos de escalamiento

Los incidentes se escalan en función de su gravedad e impacto:

Coordinación del equipo a través del canal dedicado de Slack #incidents
Notificación a la dirección por correo electrónico para incidentes de alta gravedad
Comunicación con el cliente para incidentes que afecten al servicio
Notificación regulatoria si lo requiere el RGPD u otros marcos de cumplimiento

Planificación de la continuidad del negocio

Más allá de la respuesta a incidentes, mantenemos procedimientos de continuidad del negocio que incluyen:

Capacidades de respaldo y recuperación ante desastres
Monitoreo de dependencias de terceros y planificación de contingencias
Redundancia de infraestructura para servicios críticos
Procedimientos de retención y recuperación de datos
Mecanismos de conmutación por error (failover) y resiliencia del proveedor de IA

Conmutación por error y resiliencia del proveedor de IA

Para garantizar la continuidad de los servicios de cumplimiento impulsados por IA durante las interrupciones del proveedor, ISMS Copilot implementa mecanismos de conmutación por error automáticos:

Ruta del proveedor predeterminado (Anthropic/OpenAI):

Monitoreo con disyuntor (Circuit Breaker): El seguimiento de salud en tiempo real del proveedor de IA principal (Anthropic Claude) monitorea errores 5xx, límites de tasa 529 y fallas de red en una ventana de tiempo deslizante
Conmutación por error automática: Cuando los errores superan el umbral, las solicitudes se dirigen automáticamente al proveedor de respaldo (OpenAI) sin intervención del usuario
Recuperación automática: El sistema sondea periódicamente al proveedor principal para detectar la recuperación y volver a cambiar cuando esté saludable
Notificación al usuario: Un banner persistente alerta a los usuarios durante los eventos de conmutación por error mientras el servicio continúa sin interrupciones
Omisión de selección de proveedor: Los usuarios que seleccionan explícitamente modelos específicos (ej. Gemini, Grok, Mistral) omiten la conmutación por error automática; se respeta su selección

La conmutación por error automática proporciona alta disponibilidad para la mayoría de los usuarios en las rutas predeterminadas, minimizando la interrupción durante los incidentes del proveedor de IA.

Modo de protección de datos avanzada (solo UE a través de Mistral):

Sin conmutación por error disponible: Los usuarios con la Protección de Datos Avanzada habilitada (procesamiento exclusivo en la UE) utilizan Mistral AI exclusivamente
Limitación de proveedor único: Mistral es actualmente nuestro único proveedor basado en la UE con acuerdos de retención cero, por lo que no existe un respaldo en la UE
Impacto en el servicio: Las interrupciones de Mistral pueden causar interrupciones en el servicio para los usuarios de solo la UE hasta que el proveedor se recupere
Justificación del compromiso: El modo exclusivo de la UE prioriza la soberanía de los datos y la retención cero sobre la resiliencia de la conmutación por error
Mejora futura: Estamos trabajando activamente para añadir un segundo proveedor en la UE para permitir la conmutación por error a los usuarios de Protección de Datos Avanzada

Las organizaciones que eligen el Modo de Protección de Datos Avanzada aceptan este compromiso de disponibilidad a cambio de una estricta residencia de datos en la UE y retención cero por parte del proveedor de IA. Para requisitos críticos de tiempo de actividad, evalúe si el modo predeterminado (con conmutación por error automática pero procesamiento en EE. UU.) es aceptable para su postura de cumplimiento.

Monitoreo y transparencia:

Las métricas de salud del proveedor se monitorean continuamente mediante instrumentación de disyuntores
Los eventos de conmutación por error se registran y revisan en el análisis posterior al incidente
Las comunicaciones en la página de estado informan a los usuarios sobre incidentes en curso del proveedor
El estado del disyuntor se expone a través de un endpoint de monitoreo interno para visibilidad operativa

Los incidentes posteriores al despliegue activan nuestros procedimientos de reversión (rollback) de gestión de cambios mientras se mantiene la documentación del incidente para su revisión.

Documentación y aprendizaje

Cada incidente genera documentación que incluye la cronología, la evaluación del impacto, la causa raíz y las acciones preventivas. Estos aprendizajes se integran en nuestro registro de riesgos y en la planificación de prevención de amenazas.

Nuestros procedimientos de gestión de incidentes se alinean con nuestro marco general de ISMS y respaldan los requisitos de cumplimiento de SOC 2, ISO 27001 y NIST.

¿Te fue útil?