Vorfallmanagement und Business Continuity

ISMS Copilot hat Verfahren für das Vorfallmanagement und die Aufrechterhaltung des Geschäftsbetriebs (Business Continuity) etabliert, um eine schnelle Erkennung, Eindämmung und Wiederherstellung bei Sicherheitsvorfällen oder Serviceunterbrechungen zu gewährleisten. Unser Ansatz priorisiert den Schutz von Kundendaten und die Serviceverfügbarkeit.

Die Reaktion auf Vorfälle ist in unseren Change-Management-Prozess und unsere Eskalationsverfahren integriert, um eine koordinierte Reaktion sicherzustellen.

Prozess zur Reaktion auf Vorfälle

Unser Vorfallmanagement folgt einem fünfstufigen Ansatz:

Erkennung — Überwachungssysteme, Kundenberichte oder Sicherheitsscans identifizieren potenzielle Vorfälle
Bewertung — Schweregrad und Umfang des Vorfalls werden evaluiert, um die Reaktionsebene zu bestimmen
Eindämmung — Sofortige Maßnahmen zur Begrenzung der Auswirkungen und zur Verhinderung der Ausbreitung
Wiederherstellung — Systeme werden in den Normalbetrieb zurückversetzt und Fehlerbehebungen implementiert
Überprüfung nach dem Vorfall — Durchführung einer Ursachenanalyse und Implementierung von Präventivmaßnahmen

Rollen und Verantwortlichkeiten

Unser Team für die Reaktion auf Vorfälle umfasst definierte Rollen:

Incident Commander — Der CEO leitet die allgemeine Koordinierung der Reaktion und die Kommunikation mit den Stakeholdern
Primäre und sekundäre Rufbereitschaft — Technische Experten stehen für eine schnelle Bewertung und Behebung zur Verfügung
Communication Lead — Verwaltet Kundenbenachrichtigungen und Status-Updates

Bei Sicherheitsvorfällen, die Kundendaten betreffen oder Auswirkungen auf die Compliance haben, eskalieren wir sofort an die Unternehmensführung.

Eskalationsverfahren

Vorfälle werden basierend auf Schweregrad und Auswirkungen eskaliert:

Teamkoordination über den dedizierten Slack-Kanal #incidents
Benachrichtigung der Geschäftsführung per E-Mail bei Vorfällen mit hohem Schweregrad
Kundenkommunikation bei Vorfällen, die den Service beeinträchtigen
Meldung an Behörden, falls durch die DSGVO oder andere Compliance-Rahmenwerke erforderlich

Business Continuity Planung

Über die Reaktion auf Vorfälle hinaus unterhalten wir Verfahren zur Aufrechterhaltung des Geschäftsbetriebs, einschließlich:

Backup- und Disaster-Recovery-Funktionen
Überwachung von Drittanbieter-Abhängigkeiten und Notfallplanung
Infrastruktur-Redundanz für kritische Dienste
Datenaufbewahrung und Wiederherstellungsverfahren
Failover- und Resilienzmechanismen für KI-Anbieter

Failover und Resilienz der KI-Anbieter

Um die Kontinuität der KI-gestützten Compliance-Dienste während Ausfällen von Anbietern zu gewährleisten, implementiert ISMS Copilot automatische Failover-Mechanismen:

Standard-Anbieterpfad (Anthropic/OpenAI):

Circuit Breaker Monitoring: Echtzeit-Zustandsüberwachung des primären KI-Anbieters (Anthropic Claude) überwacht 5xx-Fehler, 529-Ratenbegrenzungen und Netzwerkausfälle in einem gleitenden Zeitfenster
Automatisches Failover: Wenn Fehler den Schwellenwert überschreiten, werden Anfragen ohne Benutzereingriff automatisch an den Backup-Anbieter (OpenAI) weitergeleitet
Automatische Wiederherstellung: Das System prüft den primären Anbieter regelmäßig, um eine Erholung zu erkennen und bei gesundem Status zurückzuschalten
Benutzerbenachrichtigung: Ein permanenter Banner informiert Benutzer während Failover-Ereignissen, während der Dienst unterbrechungsfrei weiterläuft
Umgehung der Anbieterwahl: Benutzer, die explizit bestimmte Modelle auswählen (z. B. Gemini, Grok, Mistral), umgehen das automatische Failover – ihre Auswahl wird respektiert

Automatisches Failover bietet eine hohe Verfügbarkeit für die Mehrheit der Benutzer auf den Standardpfaden und minimiert Unterbrechungen bei Vorfällen der KI-Anbieter.

Erweiterter Datenschutzmodus (Nur EU über Mistral):

Kein Failover verfügbar: Benutzer mit aktiviertem erweiterten Datenschutz (Verarbeitung nur in der EU) nutzen ausschließlich Mistral AI
Einschränkung durch Einzelanbieter: Mistral ist derzeit unser einziger in der EU ansässiger Anbieter mit Zero-Retention-Vereinbarungen, daher existiert kein EU-Backup
Service-Auswirkungen: Ausfälle bei Mistral können zu einer Dienstunterbrechung für reine EU-Benutzer führen, bis der Anbieter wieder erreichbar ist
Begründung der Abwägung: Der Nur-EU-Modus priorisiert Datensouveränität und Zero-Retention gegenüber der Failover-Resilienz
Zukünftige Erweiterung: Wir arbeiten aktiv daran, einen zweiten EU-Anbieter hinzuzufügen, um das Failover für Benutzer des erweiterten Datenschutzes zu ermöglichen

Organisationen, die den erweiterten Datenschutzmodus wählen, akzeptieren diese Einschränkung der Verfügbarkeit im Austausch für strikte EU-Datenresidenz und Zero-Retention beim KI-Anbieter. Prüfen Sie bei kritischen Verfügbarkeitsanforderungen, ob der Standardmodus (mit automatischem Failover, aber US-Verarbeitung) für Ihre Compliance-Anforderungen akzeptabel ist.

Überwachung und Transparenz:

Zustandsmetriken der Anbieter werden kontinuierlich über die Circuit-Breaker-Instrumentierung überwacht
Failover-Ereignisse werden protokolliert und in der Post-Incident-Analyse überprüft
Kommunikation über die Statusseite informiert Benutzer über laufende Vorfälle bei Anbietern
Der Circuit-Breaker-Status wird über einen internen Monitoring-Endpunkt für die operative Sichtbarkeit bereitgestellt

Vorfälle nach der Bereitstellung lösen unsere Rollback-Verfahren des Change-Managements aus, wobei die Vorfalldokumentation zur Überprüfung beibehalten wird.

Dokumentation und kontinuierliches Lernen

Jeder Vorfall erzeugt eine Dokumentation einschließlich Zeitplan, Folgenabschätzung, Ursache und Präventivmaßnahmen. Diese Erkenntnisse fließen zurück in unser Risikoregister und die Bedrohungspräventionsplanung.

Unsere Verfahren zum Vorfallmanagement sind auf unser allgemeines ISMS-Rahmenwerk abgestimmt und unterstützen die SOC 2, ISO 27001 sowie NIST Compliance-Anforderungen.

War das hilfreich?