Gestion des incidents et continuité des activités

ISMS Copilot a établi des procédures de gestion des incidents et de continuité des activités afin d'assurer une détection, un confinement et une récupération rapides suite à des incidents de sécurité ou des interruptions de service. Notre approche donne la priorité à la protection des données client et à la disponibilité du service.

La réponse aux incidents est intégrée à notre processus de gestion des changements et à nos procédures d'escalade pour garantir une réponse coordonnée.

Processus de réponse aux incidents

Notre gestion des incidents suit une approche en cinq phases :

Détection — Les systèmes de surveillance, les rapports clients ou les scans de sécurité identifient les incidents potentiels
Évaluation — La gravité et la portée de l'incident sont évaluées pour déterminer le niveau de réponse
Confinement — Actions immédiates prises pour limiter l'impact et empêcher la propagation
Récupération — Systèmes restaurés en fonctionnement normal avec déploiement de correctifs
Examen post-incident — Analyse de la cause profonde effectuée et mise en œuvre de mesures préventives

Rôles et responsabilités

Notre équipe de réponse aux incidents comprend des rôles définis :

Responsable d'incident (Incident Commander) — Le CEO dirige la coordination globale de la réponse et la communication avec les parties prenantes
Astreinte primaire et secondaire — Intervenants techniques disponibles pour une évaluation et une remédiation rapides
Responsable de la communication — Gère les notifications clients et les mises à jour de statut

Pour les incidents de sécurité impliquant des données client ou des implications de conformité, nous remontons immédiatement l'information à la direction.

Procédures d'escalade

Les incidents font l'objet d'une escalade basée sur la gravité et l'impact :

Coordination de l'équipe via le canal Slack dédié #incidents
Notification de la direction par e-mail pour les incidents de haute gravité
Communication client pour les incidents affectant le service
Notification réglementaire si requise par le RGPD ou d'autres cadres de conformité

Planification de la continuité des activités

Au-delà de la réponse aux incidents, nous maintenons des procédures de continuité des activités incluant :

Capacités de sauvegarde et de reprise après sinistre
Surveillance des dépendances tierces et planification de contingence
Redondance de l'infrastructure pour les services critiques
Procédures de rétention et de récupération des données
Mécanismes de basculement et de résilience des fournisseurs d'IA

Basculement et résilience des fournisseurs d'IA

Pour assurer la continuité des services de conformité propulsés par l'IA lors des pannes de fournisseurs, ISMS Copilot implémente des mécanismes de basculement (failover) automatique :

Chemin du fournisseur par défaut (Anthropic/OpenAI) :

Surveillance par coupe-circuit (Circuit Breaker) : Le suivi de l'état de santé en temps réel du fournisseur d'IA principal (Anthropic Claude) surveille les erreurs 5xx, les limites de débit 529 et les échecs réseau dans une fenêtre glissante
Basculement automatique : Lorsque les erreurs dépassent un seuil, les requêtes sont automatiquement acheminées vers le fournisseur de secours (OpenAI) sans intervention de l'utilisateur
Récupération automatique : Le système sonde périodiquement le fournisseur principal pour détecter un rétablissement et basculer à nouveau lorsqu'il est opérationnel
Notification utilisateur : Une bannière persistante alerte les utilisateurs lors des événements de basculement pendant que le service continue sans interruption
Contournement de la sélection du fournisseur : Les utilisateurs qui sélectionnent explicitement des modèles spécifiques (ex. Gemini, Grok, Mistral) contournent le basculement automatique — leur sélection est respectée

Le basculement automatique assure une haute disponibilité pour la majorité des utilisateurs sur les chemins de fournisseurs par défaut, minimisant les perturbations lors des incidents des fournisseurs d'IA.

Mode de protection avancée des données (UE uniquement via Mistral) :

Aucun basculement disponible : Les utilisateurs ayant activé la protection avancée des données (traitement UE uniquement) utilisent exclusivement Mistral AI
Limitation à un seul fournisseur : Mistral est actuellement notre seul fournisseur basé dans l'UE disposant d'accords de non-rétention, il n'existe donc pas de secours dans l'UE
Impact sur le service : Les pannes de Mistral peuvent causer une interruption de service pour les utilisateurs « UE uniquement » jusqu'à ce que le fournisseur se rétablisse
Justification du compromis : Le mode UE donne la priorité à la souveraineté des données et à la non-rétention plutôt qu'à la résilience du basculement
Amélioration future : Nous travaillons activement à l'ajout d'un second fournisseur dans l'UE pour permettre le basculement pour les utilisateurs de la protection avancée des données

Les organisations choisissant le mode de protection avancée des données acceptent ce compromis de disponibilité en échange d'une résidence stricte des données dans l'UE et d'une rétention nulle chez le fournisseur d'IA. Pour des exigences critiques de temps de fonctionnement, évaluez si le mode par défaut (avec basculement automatique mais traitement aux États-Unis) est acceptable pour votre posture de conformité.

Surveillance et transparence :

Les mesures de santé des fournisseurs sont surveillées en continu via l'instrumentation du coupe-circuit
Les événements de basculement sont journalisés et examinés lors de l'analyse post-incident
Les communications sur la page de statut informent les utilisateurs des incidents en cours chez les fournisseurs
L'état du coupe-circuit est exposé via un point de terminaison de surveillance interne pour une visibilité opérationnelle

Les incidents post-déploiement déclenchent nos procédures de retour arrière (rollback) de gestion des changements tout en maintenant la documentation de l'incident pour examen.

Documentation et apprentissage

Chaque incident génère une documentation incluant la chronologie, l'évaluation de l'impact, la cause profonde et les actions préventives. Ces enseignements alimentent en retour notre registre des risques et notre planification de prévention des menaces.

Nos procédures de gestion des incidents sont alignées avec notre cadre global ISMS et soutiennent les exigences de conformité SOC 2, ISO 27001 et NIST.

Cela vous a-t-il été utile ?