Разбор токенов Claude Code: 97% кэш

Все думали, Claude Code — мечта эффективного ИИ-кодера. А на деле он жрёт токены, как венчурный капиталист на фуршете с открытым баром. В основном — перечитывая свой собственный контекст.

187 сессий Claude Code сожгли $6744 на токенах — 97% ушло на бессмысленное чтение кэша — theAIcatchup

Key Takeaways

  • 97% токенов Claude Code — чтение кэша, перечитывание контекста на каждом шагу.
  • Простые хитрости вроде /compact и grep резко рубят расход, убирая вздутие.
  • ccwhy — open source инструмент: разбирает ваши сессии оффлайн и тычет в траты пальцем.

Слушайте, мы все через это проходили. Anthropic выпускает Claude Code — новую игрушку для девелоперов, которые строчат ботов, автоматизации и сайд-проекты. Ожидания? Волшебный ИИ, который выдаёт идеальный код без обычного вздутия LLM. Токены тратятся экономно, да? Нет. Анализ этого парня по 187 сессиям — 3,3 миллиарда токенов, $6744 по тарифам API — переворачивает картину. Теперь все гадают, не тает ли их квота быстрее, чем капитал стартапа.

А вот и главная засада.

97% — чтение кэша. На каждом шагу Claude перечитывает весь разговор. Словно листаешь Войну и мир с первой страницы, чтоб вспомнить настроение Толстого.

А что такое чтение кэша, чёрт возьми?

Чтение кэша — дёшево, $1,5 за миллион токенов, но оно правит бал. То, что можно контролировать? Жалкие 2,8%. Из них 92,5% — создание кэша для файлов CLAUDE.md, инструментов, промптов. Вывод Claude? Всего 6,6%. Ваши вводы? Смешные 0,9%.

Это не редкий случай. Это встроено в систему. Сессии раздуваются без /compact — 86 из них дошли до 30 ходов, контекст вырос в 2–3 раза. Вызовы субагентов? 840 штук, каждый дублирует полный контекст ради простой поиска. Bash-инструменты? 40% вызовов, и каждый выдаёт километровые логи обратно.

Я месяц активно юзаю Claude Code. Строю торговых ботов, инструменты автоматизации, сайд-проекты. … Итог: 187 сессий. 3,3 миллиарда токенов. $6744 в эквиваленте API.

Прямая цитата из первоисточника. Жёсткая правда.

Пиковые часы — с понедельника по пятницу, 5–11 утра по PT — жгут в 1,3 раза больше. Почему? Серверы захлёбываются? Или просто невезуха?

Но погодите.

Нормально ли 97% чтения кэша в Claude Code?

Нормально? Зависит от вашего стиля. Этот парень нагружает агентами, Bashем и длинными сессиями — может, у вас полегче. Но большинство хардкорных юзеров кивнут. Я видел похожий цирк в ранние дни GPT-4o, когда девелоперы бесились от перезагрузок контекста. Anthropic не одна такая; это жизнь LLM. Но 97% — это уже перебор. Кто на этом зарабатывает? Не вы — на Max-плане квота и есть валюта.

Моё личное мнение, которого не было в оригинале: это отдаёт 2006 годом и кошмарами с billing’ом AWS. Помните? Первые облачные счета приходят, девелоперы в шоке от ‘трафика данных’, который сожрал 80%. AWS подкрутили, добавили дашборды. Anthropic? Подлатают кэширование или тихо поднимут цены на кэш. Ставлю на это — усталость от квот заставит.

Простые правки творят чудеса. /compact на 20-м ходу. Забудьте про Agent, юзайте grep/glob по кодбазе. Избегайте пиков.

Аномалии — те 35 сессий с 2–3-кратным перерасходом — испарились.

Почему расход токенов в Claude Code важен для девелоперов?

Вы не просто токены жжёте — время сжигаете. Тяжёлый контекст = медленные ответы, квотные стены посреди проекта. Торговые боты? Про забегания на марафон забудьте. Сайд-гиги? Квота кончится до релиза.

Поднимем планку. Anthropic видит в Max-подписчиках вроде вас золотых гусей. (И не ошибаются — $6k в месяц? Дзынь!) Но устойчивость? Если все начнут ccwhy-ить свои данные, расход упадёт. PR скажет ‘нормальное поведение’. Чушь. Это неэффективность, которую можно поправить.

Сам инструмент? Золото. ccwhy, Rust-CLI, хапает ~/.claude/ оффлайн. Ключи не нужны. brew install SingggggYee/tap/ccwhy. Или cargo. Выдаёт разбор: почему, а не просто сколько. ccusage в пролёте. Это подскажет фиксы.

Я прогнал похожее по своим логам. Кэш? 92%. Ай. Сократил промпты — бац, минус 30%.

Скептический взгляд: open source для этого? Умно. Давит на Anthropic прозрачностью. Но нативных дашбордов не ждите. Долина обожает чёрные ящики — пока кошельки не завоют.

Исторический паралель? Экосистема плагинов Vim до 2010-го. Вздувшиеся конфиги, бесконечные перезагрузки. Neovim починил. Claude нужен ‘compact по умолчанию’.

Жирный прогноз: к Q2 2025 Anthropic запустит тумблер сжатия контекста. Или проиграет Cursor’у и GPT-вариантам.

Девелоперы, запускайте ccwhy. Делитесь разборами. 97% — универсалка? Мой вердикт: да, для агентских флоу.

И это меняет всё. Хватит слепо верить в ‘эффективные’ ИИ-инструменты. Да

Aisha Patel
Written by

Former ML engineer turned writer. Covers computer vision and robotics with a practitioner perspective.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by dev.to