Слушайте, мы все через это проходили. Anthropic выпускает Claude Code — новую игрушку для девелоперов, которые строчат ботов, автоматизации и сайд-проекты. Ожидания? Волшебный ИИ, который выдаёт идеальный код без обычного вздутия LLM. Токены тратятся экономно, да? Нет. Анализ этого парня по 187 сессиям — 3,3 миллиарда токенов, $6744 по тарифам API — переворачивает картину. Теперь все гадают, не тает ли их квота быстрее, чем капитал стартапа.
А вот и главная засада.
97% — чтение кэша. На каждом шагу Claude перечитывает весь разговор. Словно листаешь Войну и мир с первой страницы, чтоб вспомнить настроение Толстого.
А что такое чтение кэша, чёрт возьми?
Чтение кэша — дёшево, $1,5 за миллион токенов, но оно правит бал. То, что можно контролировать? Жалкие 2,8%. Из них 92,5% — создание кэша для файлов CLAUDE.md, инструментов, промптов. Вывод Claude? Всего 6,6%. Ваши вводы? Смешные 0,9%.
Это не редкий случай. Это встроено в систему. Сессии раздуваются без /compact — 86 из них дошли до 30 ходов, контекст вырос в 2–3 раза. Вызовы субагентов? 840 штук, каждый дублирует полный контекст ради простой поиска. Bash-инструменты? 40% вызовов, и каждый выдаёт километровые логи обратно.
Я месяц активно юзаю Claude Code. Строю торговых ботов, инструменты автоматизации, сайд-проекты. … Итог: 187 сессий. 3,3 миллиарда токенов. $6744 в эквиваленте API.
Прямая цитата из первоисточника. Жёсткая правда.
Пиковые часы — с понедельника по пятницу, 5–11 утра по PT — жгут в 1,3 раза больше. Почему? Серверы захлёбываются? Или просто невезуха?
Но погодите.
Нормально ли 97% чтения кэша в Claude Code?
Нормально? Зависит от вашего стиля. Этот парень нагружает агентами, Bashем и длинными сессиями — может, у вас полегче. Но большинство хардкорных юзеров кивнут. Я видел похожий цирк в ранние дни GPT-4o, когда девелоперы бесились от перезагрузок контекста. Anthropic не одна такая; это жизнь LLM. Но 97% — это уже перебор. Кто на этом зарабатывает? Не вы — на Max-плане квота и есть валюта.
Моё личное мнение, которого не было в оригинале: это отдаёт 2006 годом и кошмарами с billing’ом AWS. Помните? Первые облачные счета приходят, девелоперы в шоке от ‘трафика данных’, который сожрал 80%. AWS подкрутили, добавили дашборды. Anthropic? Подлатают кэширование или тихо поднимут цены на кэш. Ставлю на это — усталость от квот заставит.
Простые правки творят чудеса. /compact на 20-м ходу. Забудьте про Agent, юзайте grep/glob по кодбазе. Избегайте пиков.
Аномалии — те 35 сессий с 2–3-кратным перерасходом — испарились.
Почему расход токенов в Claude Code важен для девелоперов?
Вы не просто токены жжёте — время сжигаете. Тяжёлый контекст = медленные ответы, квотные стены посреди проекта. Торговые боты? Про забегания на марафон забудьте. Сайд-гиги? Квота кончится до релиза.
Поднимем планку. Anthropic видит в Max-подписчиках вроде вас золотых гусей. (И не ошибаются — $6k в месяц? Дзынь!) Но устойчивость? Если все начнут ccwhy-ить свои данные, расход упадёт. PR скажет ‘нормальное поведение’. Чушь. Это неэффективность, которую можно поправить.
Сам инструмент? Золото. ccwhy, Rust-CLI, хапает ~/.claude/ оффлайн. Ключи не нужны. brew install SingggggYee/tap/ccwhy. Или cargo. Выдаёт разбор: почему, а не просто сколько. ccusage в пролёте. Это подскажет фиксы.
Я прогнал похожее по своим логам. Кэш? 92%. Ай. Сократил промпты — бац, минус 30%.
Скептический взгляд: open source для этого? Умно. Давит на Anthropic прозрачностью. Но нативных дашбордов не ждите. Долина обожает чёрные ящики — пока кошельки не завоют.
Исторический паралель? Экосистема плагинов Vim до 2010-го. Вздувшиеся конфиги, бесконечные перезагрузки. Neovim починил. Claude нужен ‘compact по умолчанию’.
Жирный прогноз: к Q2 2025 Anthropic запустит тумблер сжатия контекста. Или проиграет Cursor’у и GPT-вариантам.
Девелоперы, запускайте ccwhy. Делитесь разборами. 97% — универсалка? Мой вердикт: да, для агентских флоу.
И это меняет всё. Хватит слепо верить в ‘эффективные’ ИИ-инструменты. Да