Implementation Kit · KI Praxis Insider

Claude Code
Token-Optimierung
Cheat Sheet

Alle fünf Hebel auf einen Blick – sofort anwendbar.

Hans Peter Heitzmann · aimadesimple.at
April 2026
1 · Kontext-Management — größter Impact
Wichtigster Hebel

/compact

Komprimiert die Konversationshistorie ohne Kontext-Verlust. Bei ~60% Auslastung nutzen – nicht erst bei der Warnung.

Vor dem Ausführen: Claude kurz sagen was wichtig ist. 10 Sekunden – rettet den Kontext.
Bei Themenwechsel

/clear

Kompletter Reset. Bei neuer, unabhängiger Aufgabe nutzen.

Profi-Tipp

Neues Terminal

Neues Terminal = neues Kontextfenster. Wer eine komplett neue Aufgabe startet, öffnet einfach ein frisches Terminal – Claude beginnt mit leerem Kontext und vollem Platz zum Arbeiten.

Dateien ausschließen

.claudeignore

Irrelevante Files vom Laden ausschließen – wie .gitignore.

Timing beachten

Pausen ≤ 5 min

Längere Pausen können volles Context-Reprocessing triggern.

2 · Modell-Wahl — schnellster Gewinn
Sparsam
Opus
Komplexe Architektur · Multi-File-Refactors. Sonst nie.
Default ✓
Sonnet
80% aller Aufgaben. Stark genug, Token-schonend.
Unterschätzt
Haiku
Umbenennen, Formatieren, repetitive Tasks. Sehr schnell.

Wechsel jederzeit per /model

3 · CLAUDE.md schlank halten — Ziel: unter 500 Token
Was reingehört
Build-Commands (npm run test)
Code-Style-Regeln die Claude nicht selbst ableiten kann
Projektspezifische Architekturentscheidungen
Testing-Konventionen
Was NICHT reingehört
„Write clean code" · „Follow best practices"
Dinge die Claude ohnehin richtig macht
Domain-Wissen das nur manchmal gebraucht wird
Generische Anweisungen ohne konkreten Effekt
Profi-Tipp: @imports statt alles inline

Detaillierte Anweisungen auslagern und per Referenz einbinden. Claude lädt den Inhalt nur wenn relevant.

# CLAUDE.md (schlank) - TypeScript strict mode - Tests für jede neue Funktion ## Key Files - Git-Workflow: @docs/git-instructions.md - Style Guide: @docs/style-guide.md
4 · Thinking-Tokens reduzieren
Aufwand senken

/effort low

Für einfache, klare Tasks nutzen.

Deaktivieren

Thinking off

In /config deaktivieren wenn nicht nötig.

Budget setzen

Max 8.000

MAX_THINKING_TOKENS=8000 setzen.

5 · Usage sichtbar machen
claude-monitor
Empfohlen · Echtzeit
Im zweiten Terminal laufen lassen. Immer im Blick.
pip install claude-monitor claude-monitor --plan max5 --timezone Europe/Vienna
ccusage
Historisch · Kein Install
Nachanalyse der Verbrauchsmuster.
npx ccusage blocks --plan max5
VS Code Extension
Dauerhaft sichtbar
Marketplace: ccusage-vscode
Schnell-Check vor jeder Session