Erste Schritte

Verwalten langer Konversationen und der Nutzung

Wie Sie Ihre Konversationen strukturieren, hat direkten Einfluss auf Ihren Credit-Verbrauch. Der effektivste Weg, den Wert Ihres Abonnements zu maximieren, besteht darin, zu wissen, wann ein Thread fortgesetzt und wann ein neuer gestartet werden sollte.

Gute Nachricht: Die automatische Komprimierung (Conversation Compaction) ist jetzt für den Think-Modus (Claude Opus 4.6) verfügbar. Konversationen im Think-Modus können jetzt unbegrenzt fortgesetzt werden, ohne Token-Limits zu erreichen – das System fasst frühere Nachrichten bei Annäherung an ~150.000 Token automatisch im Hintergrund zusammen. Details finden Sie im Produkt-Changelog.

Warum lange Konversationen mehr kosten

Jedes Mal, wenn Sie eine Nachricht senden, überprüft die KI Ihren gesamten Konversationsverlauf, um den Kontext zu wahren und relevante Antworten zu geben. In einer Konversation mit 3 Nachrichten ist der Aufwand minimal. In einem Thread mit 50 Nachrichten verarbeitet die KI deutlich mehr Informationen – etwa so, als würde man jedes Mal einen ganzen Ordner fotokopieren, wenn man eine einzige Seite hinzufügt.

Das ist kein Fehler, sondern die Art und Weise, wie Konversationskontext funktioniert. Es bedeutet jedoch, dass sehr lange Threads Credits viel schneller verbrauchen als kurze.

Eine einzelne Nachricht in einer Konversation mit mehr als 50 Nachrichten kann 5- bis 10-mal mehr Credits verbrauchen als dieselbe Nachricht in einer neuen Konversation. Für Nutzer des Think-Modus: Die automatische Komprimierung reduziert diese Auswirkungen nun drastisch, indem sie ältere Nachrichten zusammenfasst und gleichzeitig den Kontext bewahrt.

Think-Modus: Unbegrenzte Konversationen

Der Think-Modus (Claude Opus 4.6) unterstützt jetzt durch automatische Komprimierung unbegrenzte Konversationslängen. Wenn sich Ihre Konversation dem Schwellenwert von ~150.000 Token nähert, fasst das System frühere Nachrichten automatisch im Hintergrund zusammen, sodass Sie nahtlos fortfahren können.

Was passiert:

  • Sie sehen eine kurze Anzeige „Konversation wird komprimiert...“ (gelber Fortschrittsbalken)

  • Der Vorgang dauert nur wenige Sekunden

  • Ihre Konversation wird fortgesetzt, wobei der vollständige Kontext erhalten bleibt

  • Es ist nicht nötig, neu zu beginnen oder den Kontext zu verlieren

Bestens geeignet für: Komplexe, iterative Compliance-Arbeiten wie umfassende Gap-Analysen, Mappings über mehrere Frameworks hinweg oder detaillierte Richtlinienprüfungen, die einen erweiterten Kontext erfordern.

Wann Sie fortfahren und wann Sie neu beginnen sollten

Setzen Sie dieselbe Konversation fort, wenn:

  • Die KI sich an spezifische Details aus den letzten 2–5 Nachrichten erinnern muss

  • Sie ein Dokument über mehrere Iterationen hinweg verfeinern

  • Sie einen mehrstufigen Prozess durchlaufen (z. B. Gap-Analyse → Empfehlungen → Implementierungsplan)

  • Sie sich im Think-Modus befinden und an komplexen Analysen arbeiten (unbegrenzte Konversation unterstützt)

  • Sie Folgefragen stellen, die sich direkt auf vorherige Antworten beziehen

Starten Sie eine neue Konversation, wenn:

  • Sie zu einem völlig anderen Thema oder Framework wechseln

  • Sie den Fast-Modus verwenden und der Thread mehr als 20 Nachrichten umfasst

  • Die KI sich nicht an den früheren Kontext erinnern muss

  • Sie eine Aufgabe abgeschlossen haben und eine neue beginnen

  • Sie ein neues großes Dokument für eine nicht damit zusammenhängende Analyse hochladen

  • Die Konversation vom Thema abgekommen ist oder irrelevante Historie angesammelt hat

Best Practice: Betrachten Sie Konversationen als fokussierte Arbeitssitzungen. Eine Konversation = eine Compliance-Aufgabe. Im Think-Modus können Sie erweiterte Analysen unbegrenzt fortsetzen. Starten Sie im Fast-Modus nach 15–20 Nachrichten neu.

Praktische Beispiele

Beispiel 1: Richtlinienentwicklung

❌ Ineffizienter Ansatz:

  1. Nachricht 1: „Erstelle eine ISO 27001 Zugriffskontrollrichtlinie“

  2. Nachrichten 2–10: Verfeinerung der Richtlinie durch Iterationen

  3. Nachricht 11: „Erstelle nun eine Incident-Response-Richtlinie“

  4. Nachrichten 12–20: Verfeinerung der Incident-Response-Richtlinie

  5. Nachricht 21: „Erstelle nun eine Vorlage für die Risikobewertung“

  6. Nachrichten 22–35: Fortführung der Arbeit... (Credits werden im Fast-Modus schnell verbraucht)

✅ Effizienter Ansatz:

  1. Konversation 1 (Zugriffskontrolle): Entwurf und Verfeinerung der Zugriffskontrollrichtlinie (10 Nachrichten)

  2. Konversation 2 (Incident Response): Neustart, Entwurf und Verfeinerung der Incident Response (10 Nachrichten)

  3. Konversation 3 (Risikobewertung): Neustart, Erstellung der Risikovorlage (8 Nachrichten)

Gleiche Arbeit, aber weitaus weniger Credit-Verbrauch.

Beispiel 2: Gap-Analyse

✅ Gute Nutzung einer Konversation (Think-Modus empfohlen):

  1. Laden Sie Ihr aktuelles Richtliniendokument hoch

  2. Fordern Sie eine Gap-Analyse gemäß ISO 27001 an

  3. Stellen Sie klärende Fragen zu spezifischen Lücken (3–5 Nachrichten)

  4. Fordern Sie prioritätsbasierte Empfehlungen zur Behebung an

  5. Fahren Sie mit einer detaillierten Analyse Maßnahme für Maßnahme fort (Think-Modus bewältigt unbegrenzte Länge)

Dies profitiert vom kontinuierlichen Kontext. Die KI erinnert sich an das hochgeladene Dokument und die vorherigen Ergebnisse.

❌ Fahren Sie danach nicht fort mit: „Erstelle nun eine Richtlinie für die erste Lücke“, es sei denn, Sie führen umfassende Implementierungsarbeiten im Think-Modus durch. Verwenden Sie im Fast-Modus eine neue Konversation für die Implementierung.

Beispiel 3: Beratung für mehrere Clients

Nutzen Sie Workspaces + Konversationen pro Aufgabe:

  • Client A Workspace: Separate Konversationen für Risikobewertung, Richtlinienprüfung, Audit-Vorbereitung (Think-Modus für umfassende Arbeiten)

  • Client B Workspace: Separate Konversationen für SOC 2 Gap-Analyse, Maßnahmenimplementierung, Tests

Jede Aufgabe erhält eine fokussierte Konversation. Workspaces halten Clients getrennt. Siehe Managing Multi-Client Projects with Workspaces.

Dateiuploads und Konversationsstrategie

Große Dokumente verbrauchen zusätzliche Credits, besonders in langen Konversationen. Folgen Sie diesen Richtlinien:

  • Laden Sie Dateien wenn möglich in neuen Konversationen hoch

  • Schließen Sie alle Analysen und Fragen zu diesem Dokument in einem fokussierten Thread ab

  • Wenn Sie ein weiteres Dokument hochladen müssen, starten Sie eine neue Konversation, es sei denn, die Dateien stehen in direktem Zusammenhang

  • Für Think-Modus: Erweiterte Dateianalysen werden durch automatische Komprimierung unterstützt

Wenn Sie eine umfassende Dokumentenanalyse durchführen (z. B. Prüfung von 5 Richtlinien gegen ISO 27001), unterstützt der Think-Modus nun unbegrenzte Analysen in einer einzigen Konversation. Im Fast-Modus sollten Sie in Erwägung ziehen, jede Richtlinie in einer separaten Konversation hochzuladen.

Erkennen, wann eine Konversation zu lang ist (Fast-Modus)

Achten Sie im Fast-Modus auf diese Anzeichen:

  • Sie haben mehr als 15–20 Nachrichten in einem Thread

  • Sie haben das Thema gegenüber Ihrer ursprünglichen Frage gewechselt

  • Sie erreichen Nutzungslimits schneller als erwartet

  • Sie müssen deutlich scrollen, um den Anfang der Konversation zu sehen

Wenn Sie diese Muster bemerken, beenden Sie Ihre aktuelle Aufgabe und starten Sie eine neue Konversation für die nächste. Oder wechseln Sie für erweiterte Arbeiten in den Think-Modus.

Konversationslimit im Free-Tarif

Konversationen im kostenlosen Tarif haben ein Limit von 300.000 Token pro Konversation. Wenn Sie dieses Limit erreichen, wird oben in Ihrer Konversation ein Hinweis „Konversationslimit erreicht“ angezeigt.

Was der Hinweis „Konversationslimit erreicht“ anzeigt

Wenn Sie das Limit von 300.000 Token in einem kostenlosen Konto erreichen, sehen Sie:

  • Lila Hinweiskarte oben in Ihrer Konversation, die das Limit erklärt

  • Deaktiviertes Chat-Eingabefeld – Sie können in dieser Konversation keine weiteren Nachrichten senden

  • Zwei Optionen zum Fortfahren:

    • „Neue Konversation starten“ – beginnt eine neue Konversation mit frischem Token-Zähler

    • „Upgrade“ – öffnet den Upgrade-Dialog zur Auswahl eines kostenpflichtigen Tarifs mit unbegrenzten Konversationen

Das Limit von 300.000 Token gilt nur für Konversationen im kostenlosen Tarif. Kostenpflichtige Tarife (Plus, Standard, Pro und Business) haben unbegrenzte Konversationslängen.

So lösen Sie das Konversationslimit

Option 1: Eine neue Konversation starten

Klicken Sie auf „Neue Konversation starten“, um neu zu beginnen. Ihre vorherige Konversation bleibt in Ihrem Verlauf erhalten, aber Sie starten mit einem leeren Token-Konto für neue Nachrichten.

Option 2: Upgrade auf Plus oder höher

Klicken Sie auf „Upgrade“, um den Dialog zur Tarifauswahl zu öffnen. Der Plus-Tarif ($24/Monat oder $240/Jahr) hebt das Token-Limit pro Konversation auf und bietet:

  • Unbegrenzte Konversationslänge

  • Höhere Nutzungskontingente für die tägliche Compliance-Arbeit

  • Mehr Dateiuploads und Dokumentenerstellung

  • Standard-Support

Siehe Abonnements und Preise für einen vollständigen Tarifvergleich.

Wenn Sie regelmäßig das Limit von 300.000 Token erreichen, hebt ein Upgrade auf Plus diese Einschränkung vollständig auf und erhöht gleichzeitig Ihre Nutzungskontingente pro Sitzung.

Modellauswahl und Konversationslänge

  • Think-Modus (Claude Opus 4.6): Die automatische Komprimierung ermöglicht unbegrenzte Konversationen – ideal für komplexe, langwierige Compliance-Arbeiten

  • Fast-Modus (Claude Sonnet 4): Eignet sich gut für schnelle, fokussierte Konversationen; starten Sie nach 15–20 Nachrichten neu

  • Andere Modelle: Es gelten Standardlimits für die Konversationslänge; strukturieren Sie Konversationen entsprechend

Für lange, iterative Compliance-Aufgaben bietet der Think-Modus durch die automatische Kontextverwaltung nun den besten Wert.

Kurztipps für effiziente Nutzung

  1. Nutzen Sie den Think-Modus für umfangreiche Arbeiten – die automatische Komprimierung ermöglicht unbegrenzte Konversationen

  2. Eine Aufgabe, eine Konversation. Kombinieren Sie nicht mehrere unabhängige Compliance-Fragen in einem Thread.

  3. Fast-Modus: Nach 15–20 Nachrichten neu starten

  4. Große Dateien in neuen Konversationen hochladen, nicht in bereits bestehenden langen Threads (außer im Think-Modus)

  5. Nutzen Sie Workspaces zur Organisation, nicht übermäßig lange Konversations-Threads.

  6. Stellen Sie vollständige Fragen zu Beginn, anstatt den Kontext über viele Nachrichten zu verteilen.

Das Starten neuer Konversationen bedeutet nicht, dass Sie alte Arbeit verlieren. Alle Konversationen bleiben gemäß den Aufbewahrungseinstellungen Ihres Tarifs in Ihrem Verlauf zugänglich. Neue Threads optimieren den Credit-Verbrauch im Fast-Modus; der Think-Modus verarbeitet lange Konversationen automatisch.

Auswirkungen auf verschiedene Tarife

Free-Tarif: Die Verwaltung der Konversationslänge ist entscheidend. Aufgrund Ihrer begrenzten Credits pro Sitzung führen lange Threads schnell zum Erreichen Ihres Limits. Zusätzlich gilt ein Limit von 300.000 Token – danach müssen Sie eine neue Konversation starten oder upgraden. Halten Sie Konversationen kurz und fokussiert oder nutzen Sie den Think-Modus strategisch für komplexe Aufgaben.

Plus-Tarif: Der Zugriff auf den Think-Modus ermöglicht unbegrenzte Konversationslängen für komplexe Analysen. Die höhere Credit-Zuweisung bietet Flexibilität für beide Modi.

Pro ($100/Monat): Voller Zugriff auf die automatische Komprimierung des Think-Modus für unbegrenzte, erweiterte Konversationen.

Verwandte Ressourcen

  • Ihre erste Konversation starten – Best Practices für effektives Messaging

  • Managing Multi-Client Projects with Workspaces – Arbeit effizient organisieren

  • Fehler: Konversation zu lang – Token-Limits und Komprimierung verstehen

  • Abonnements und Preise – Tarifvergleich und Limits

War das hilfreich?