Verwalten langer Konversationen und der Nutzung
Wie Sie Ihre Konversationen strukturieren, hat direkten Einfluss auf Ihren Credit-Verbrauch. Der effektivste Weg, den Wert Ihres Abonnements zu maximieren, besteht darin, zu wissen, wann ein Thread fortgesetzt und wann ein neuer gestartet werden sollte.
Gute Nachricht: Die automatische Komprimierung (Conversation Compaction) ist jetzt für den Think-Modus (Claude Opus 4.6) verfügbar. Konversationen im Think-Modus können jetzt unbegrenzt fortgesetzt werden, ohne Token-Limits zu erreichen – das System fasst frühere Nachrichten bei Annäherung an ~150.000 Token automatisch im Hintergrund zusammen. Details finden Sie im Produkt-Changelog.
Warum lange Konversationen mehr kosten
Jedes Mal, wenn Sie eine Nachricht senden, überprüft die KI Ihren gesamten Konversationsverlauf, um den Kontext zu wahren und relevante Antworten zu geben. In einer Konversation mit 3 Nachrichten ist der Aufwand minimal. In einem Thread mit 50 Nachrichten verarbeitet die KI deutlich mehr Informationen – etwa so, als würde man jedes Mal einen ganzen Ordner fotokopieren, wenn man eine einzige Seite hinzufügt.
Das ist kein Fehler, sondern die Art und Weise, wie Konversationskontext funktioniert. Es bedeutet jedoch, dass sehr lange Threads Credits viel schneller verbrauchen als kurze.
Eine einzelne Nachricht in einer Konversation mit mehr als 50 Nachrichten kann 5- bis 10-mal mehr Credits verbrauchen als dieselbe Nachricht in einer neuen Konversation. Für Nutzer des Think-Modus: Die automatische Komprimierung reduziert diese Auswirkungen nun drastisch, indem sie ältere Nachrichten zusammenfasst und gleichzeitig den Kontext bewahrt.
Think-Modus: Unbegrenzte Konversationen
Der Think-Modus (Claude Opus 4.6) unterstützt jetzt durch automatische Komprimierung unbegrenzte Konversationslängen. Wenn sich Ihre Konversation dem Schwellenwert von ~150.000 Token nähert, fasst das System frühere Nachrichten automatisch im Hintergrund zusammen, sodass Sie nahtlos fortfahren können.
Was passiert:
Sie sehen eine kurze Anzeige „Konversation wird komprimiert...“ (gelber Fortschrittsbalken)
Der Vorgang dauert nur wenige Sekunden
Ihre Konversation wird fortgesetzt, wobei der vollständige Kontext erhalten bleibt
Es ist nicht nötig, neu zu beginnen oder den Kontext zu verlieren
Bestens geeignet für: Komplexe, iterative Compliance-Arbeiten wie umfassende Gap-Analysen, Mappings über mehrere Frameworks hinweg oder detaillierte Richtlinienprüfungen, die einen erweiterten Kontext erfordern.
Wann Sie fortfahren und wann Sie neu beginnen sollten
Setzen Sie dieselbe Konversation fort, wenn:
Die KI sich an spezifische Details aus den letzten 2–5 Nachrichten erinnern muss
Sie ein Dokument über mehrere Iterationen hinweg verfeinern
Sie einen mehrstufigen Prozess durchlaufen (z. B. Gap-Analyse → Empfehlungen → Implementierungsplan)
Sie sich im Think-Modus befinden und an komplexen Analysen arbeiten (unbegrenzte Konversation unterstützt)
Sie Folgefragen stellen, die sich direkt auf vorherige Antworten beziehen
Starten Sie eine neue Konversation, wenn:
Sie zu einem völlig anderen Thema oder Framework wechseln
Sie den Fast-Modus verwenden und der Thread mehr als 20 Nachrichten umfasst
Die KI sich nicht an den früheren Kontext erinnern muss
Sie eine Aufgabe abgeschlossen haben und eine neue beginnen
Sie ein neues großes Dokument für eine nicht damit zusammenhängende Analyse hochladen
Die Konversation vom Thema abgekommen ist oder irrelevante Historie angesammelt hat
Best Practice: Betrachten Sie Konversationen als fokussierte Arbeitssitzungen. Eine Konversation = eine Compliance-Aufgabe. Im Think-Modus können Sie erweiterte Analysen unbegrenzt fortsetzen. Starten Sie im Fast-Modus nach 15–20 Nachrichten neu.
Praktische Beispiele
Beispiel 1: Richtlinienentwicklung
❌ Ineffizienter Ansatz:
Nachricht 1: „Erstelle eine ISO 27001 Zugriffskontrollrichtlinie“
Nachrichten 2–10: Verfeinerung der Richtlinie durch Iterationen
Nachricht 11: „Erstelle nun eine Incident-Response-Richtlinie“
Nachrichten 12–20: Verfeinerung der Incident-Response-Richtlinie
Nachricht 21: „Erstelle nun eine Vorlage für die Risikobewertung“
Nachrichten 22–35: Fortführung der Arbeit... (Credits werden im Fast-Modus schnell verbraucht)
✅ Effizienter Ansatz:
Konversation 1 (Zugriffskontrolle): Entwurf und Verfeinerung der Zugriffskontrollrichtlinie (10 Nachrichten)
Konversation 2 (Incident Response): Neustart, Entwurf und Verfeinerung der Incident Response (10 Nachrichten)
Konversation 3 (Risikobewertung): Neustart, Erstellung der Risikovorlage (8 Nachrichten)
Gleiche Arbeit, aber weitaus weniger Credit-Verbrauch.
Beispiel 2: Gap-Analyse
✅ Gute Nutzung einer Konversation (Think-Modus empfohlen):
Laden Sie Ihr aktuelles Richtliniendokument hoch
Fordern Sie eine Gap-Analyse gemäß ISO 27001 an
Stellen Sie klärende Fragen zu spezifischen Lücken (3–5 Nachrichten)
Fordern Sie prioritätsbasierte Empfehlungen zur Behebung an
Fahren Sie mit einer detaillierten Analyse Maßnahme für Maßnahme fort (Think-Modus bewältigt unbegrenzte Länge)
Dies profitiert vom kontinuierlichen Kontext. Die KI erinnert sich an das hochgeladene Dokument und die vorherigen Ergebnisse.
❌ Fahren Sie danach nicht fort mit: „Erstelle nun eine Richtlinie für die erste Lücke“, es sei denn, Sie führen umfassende Implementierungsarbeiten im Think-Modus durch. Verwenden Sie im Fast-Modus eine neue Konversation für die Implementierung.
Beispiel 3: Beratung für mehrere Clients
Nutzen Sie Workspaces + Konversationen pro Aufgabe:
Client A Workspace: Separate Konversationen für Risikobewertung, Richtlinienprüfung, Audit-Vorbereitung (Think-Modus für umfassende Arbeiten)
Client B Workspace: Separate Konversationen für SOC 2 Gap-Analyse, Maßnahmenimplementierung, Tests
Jede Aufgabe erhält eine fokussierte Konversation. Workspaces halten Clients getrennt. Siehe Managing Multi-Client Projects with Workspaces.
Dateiuploads und Konversationsstrategie
Große Dokumente verbrauchen zusätzliche Credits, besonders in langen Konversationen. Folgen Sie diesen Richtlinien:
Laden Sie Dateien wenn möglich in neuen Konversationen hoch
Schließen Sie alle Analysen und Fragen zu diesem Dokument in einem fokussierten Thread ab
Wenn Sie ein weiteres Dokument hochladen müssen, starten Sie eine neue Konversation, es sei denn, die Dateien stehen in direktem Zusammenhang
Für Think-Modus: Erweiterte Dateianalysen werden durch automatische Komprimierung unterstützt
Wenn Sie eine umfassende Dokumentenanalyse durchführen (z. B. Prüfung von 5 Richtlinien gegen ISO 27001), unterstützt der Think-Modus nun unbegrenzte Analysen in einer einzigen Konversation. Im Fast-Modus sollten Sie in Erwägung ziehen, jede Richtlinie in einer separaten Konversation hochzuladen.
Erkennen, wann eine Konversation zu lang ist (Fast-Modus)
Achten Sie im Fast-Modus auf diese Anzeichen:
Sie haben mehr als 15–20 Nachrichten in einem Thread
Sie haben das Thema gegenüber Ihrer ursprünglichen Frage gewechselt
Sie erreichen Nutzungslimits schneller als erwartet
Sie müssen deutlich scrollen, um den Anfang der Konversation zu sehen
Wenn Sie diese Muster bemerken, beenden Sie Ihre aktuelle Aufgabe und starten Sie eine neue Konversation für die nächste. Oder wechseln Sie für erweiterte Arbeiten in den Think-Modus.
Konversationslimit im Free-Tarif
Konversationen im kostenlosen Tarif haben ein Limit von 300.000 Token pro Konversation. Wenn Sie dieses Limit erreichen, wird oben in Ihrer Konversation ein Hinweis „Konversationslimit erreicht“ angezeigt.
Was der Hinweis „Konversationslimit erreicht“ anzeigt
Wenn Sie das Limit von 300.000 Token in einem kostenlosen Konto erreichen, sehen Sie:
Lila Hinweiskarte oben in Ihrer Konversation, die das Limit erklärt
Deaktiviertes Chat-Eingabefeld – Sie können in dieser Konversation keine weiteren Nachrichten senden
Zwei Optionen zum Fortfahren:
„Neue Konversation starten“ – beginnt eine neue Konversation mit frischem Token-Zähler
„Upgrade“ – öffnet den Upgrade-Dialog zur Auswahl eines kostenpflichtigen Tarifs mit unbegrenzten Konversationen
Das Limit von 300.000 Token gilt nur für Konversationen im kostenlosen Tarif. Kostenpflichtige Tarife (Plus, Standard, Pro und Business) haben unbegrenzte Konversationslängen.
So lösen Sie das Konversationslimit
Option 1: Eine neue Konversation starten
Klicken Sie auf „Neue Konversation starten“, um neu zu beginnen. Ihre vorherige Konversation bleibt in Ihrem Verlauf erhalten, aber Sie starten mit einem leeren Token-Konto für neue Nachrichten.
Option 2: Upgrade auf Plus oder höher
Klicken Sie auf „Upgrade“, um den Dialog zur Tarifauswahl zu öffnen. Der Plus-Tarif ($24/Monat oder $240/Jahr) hebt das Token-Limit pro Konversation auf und bietet:
Unbegrenzte Konversationslänge
Höhere Nutzungskontingente für die tägliche Compliance-Arbeit
Mehr Dateiuploads und Dokumentenerstellung
Standard-Support
Siehe Abonnements und Preise für einen vollständigen Tarifvergleich.
Wenn Sie regelmäßig das Limit von 300.000 Token erreichen, hebt ein Upgrade auf Plus diese Einschränkung vollständig auf und erhöht gleichzeitig Ihre Nutzungskontingente pro Sitzung.
Modellauswahl und Konversationslänge
Think-Modus (Claude Opus 4.6): Die automatische Komprimierung ermöglicht unbegrenzte Konversationen – ideal für komplexe, langwierige Compliance-Arbeiten
Fast-Modus (Claude Sonnet 4): Eignet sich gut für schnelle, fokussierte Konversationen; starten Sie nach 15–20 Nachrichten neu
Andere Modelle: Es gelten Standardlimits für die Konversationslänge; strukturieren Sie Konversationen entsprechend
Für lange, iterative Compliance-Aufgaben bietet der Think-Modus durch die automatische Kontextverwaltung nun den besten Wert.
Kurztipps für effiziente Nutzung
Nutzen Sie den Think-Modus für umfangreiche Arbeiten – die automatische Komprimierung ermöglicht unbegrenzte Konversationen
Eine Aufgabe, eine Konversation. Kombinieren Sie nicht mehrere unabhängige Compliance-Fragen in einem Thread.
Fast-Modus: Nach 15–20 Nachrichten neu starten
Große Dateien in neuen Konversationen hochladen, nicht in bereits bestehenden langen Threads (außer im Think-Modus)
Nutzen Sie Workspaces zur Organisation, nicht übermäßig lange Konversations-Threads.
Stellen Sie vollständige Fragen zu Beginn, anstatt den Kontext über viele Nachrichten zu verteilen.
Das Starten neuer Konversationen bedeutet nicht, dass Sie alte Arbeit verlieren. Alle Konversationen bleiben gemäß den Aufbewahrungseinstellungen Ihres Tarifs in Ihrem Verlauf zugänglich. Neue Threads optimieren den Credit-Verbrauch im Fast-Modus; der Think-Modus verarbeitet lange Konversationen automatisch.
Auswirkungen auf verschiedene Tarife
Free-Tarif: Die Verwaltung der Konversationslänge ist entscheidend. Aufgrund Ihrer begrenzten Credits pro Sitzung führen lange Threads schnell zum Erreichen Ihres Limits. Zusätzlich gilt ein Limit von 300.000 Token – danach müssen Sie eine neue Konversation starten oder upgraden. Halten Sie Konversationen kurz und fokussiert oder nutzen Sie den Think-Modus strategisch für komplexe Aufgaben.
Plus-Tarif: Der Zugriff auf den Think-Modus ermöglicht unbegrenzte Konversationslängen für komplexe Analysen. Die höhere Credit-Zuweisung bietet Flexibilität für beide Modi.
Pro ($100/Monat): Voller Zugriff auf die automatische Komprimierung des Think-Modus für unbegrenzte, erweiterte Konversationen.
Verwandte Ressourcen
Ihre erste Konversation starten – Best Practices für effektives Messaging
Managing Multi-Client Projects with Workspaces – Arbeit effizient organisieren
Fehler: Konversation zu lang – Token-Limits und Komprimierung verstehen
Abonnements und Preise – Tarifvergleich und Limits