Claude Code 토큰 분석: 97% 캐시

어젯밤 터미널 앞에서 187개 Claude Code 세션 파싱 중이었다. 6744달러 토큰 태운 거. 알고 보니 거의 다 Claude가 자기 숙제 다시 읽는 짓거리.

Claude Code 세션에 6744달러 태웠다—97%가 캐시 읽기, 코드 생성은 쥐꼬리 — theAIcatchup

Key Takeaways

  • Claude Code 토큰 97%가 캐시 읽기, 실제 제어 몫은 2.8%에 불과.
  • /compact 쓰고 Agent 대신 grep으로 이상 징후 즉시 잡음.
  • ccwhy 툴이 이유 밝혀줌—오픈소스·오프라인, AI 비용 게임체인저.

책상 위 커피 식어버린 채 ~/.claude/ 파싱 로그 보던 중이었다—바로 그때 봤다: 187세션, 33억 토큰, 6744달러 날린 거.

Claude Code 토큰 사용은 생각한 거랑 완전 다르다. 우리 모두 그랬지, Anthropic 코딩 에이전트로 봇이나 자동화, 사이드 프로젝트 만들 때 효율적인 마법이라고 믿었잖아. 그런데 이 깊이 분석—Rust CLI ccwhy로 만든 거—뚜껑 제대로 열었다.

20년째 밸리 하이프 사이클 지켜본 냉소적 진실: Anthropic이 캐시 읽기로 돈 쓸어 담고, 당신은 파산 피하려 습관 고치느라 정신없다.

Claude Code 토큰 청구서가 슬쩍 다가오는 이유

97% 캐시 읽기. 매 턴마다 Claude가 대화 컨텍스트 전체 다시 읽는다—한 문단 쓰고 《전쟁과 평화》 첫 페이지로 돌아가는 꼴. 캐시는 싸긴 하다, 백만 토큰당 1.5달러지만 압도적이다.

제어 가능한 부분? 고작 2.8%. 세부: 92.5% 캐시 생성(CLAUDE.md 파일, MCP 툴, 시스템 프롬프트), 6.6% Claude 출력, 0.9% 당신 입력. 당신 몫은 그게 다다.

지난 한 달간 Claude Code 엄청 썼다. 트레이딩 봇, 자동화 툴, 사이드 프로젝트 만들면서. 토큰 많이 쓴다는 건 알았지만 숫자까지는 안 봤다.

이 개발자도 그랬다, CLI 돌리기 전까지. 이제 오픈소스—brew install SingggggYee/tap/ccwhy나 cargo install. 오프라인, 키 필요 없음. ccusage처럼 얼마 썼는지가 아니라 썼는지 알려준다.

피크 타임(월~금 오전 5~11시 PT)에 1.3배 토큰 더 썼다. Bash 툴? 호출 40%, 긴 출력 전체 다시 채움. 서브에이전트? 840회 호출, 바보 같은 검색 위해 컨텍스트 전체 복제.

86세션이 /compact 없이 30턴 넘기며 컨텍스트 2~3배 부풀음. 35개 이상 징후, 2~3배 비용. 익숙하지?

Claude Code에서 97% 캐시 읽기가 정상인가?

헤비 유저에겐 그럴 수 있다. 지속 가능할까? 닷컴 버블 때 독특한 관점: AWS 초기 데이터 전송 비용 기억나? EC2로 제국 세우다 egress 비용에 털린 개발자들. Claude 캐시가 지금 숨은 세금—Anthropic은 당신이 ~/.claude/ 안 파싱하길 바란다.

예언: 1년 내 스마트 컨텍스트 압축 내놓거나, 유저들이 Llama 같은 오픈 모델로 도망친다. 누가 진짜 이기나? 청구서 보며 멍 때리는 당신 아님.

분석 후 고친 거 효과 봤다. 20턴 후 /compact. Agent 버리고 코드베이스에 grep/glob. 무거운 작업 오프피크로. 이상 징후 싹 사라짐.

좀 빙 둘러보자—이런 툴 전에 봤다. 2010년 heroku logs가 dyno sleep 낭비 드러냈고, 개발자들이 스크립트로 우회. 같은 느낌. Claude Code 강력하지만, 제대로 안 보면 날것이다.

Bash 독주? 잔인하다. 명령 출력 전체 파이프—왜? 툴은 요약해야지, 토해 내지 말고. 서브에이전트 컨텍스트 복제? 아마추어 수준. Anthropic이 속도 우선, 똑똑함은 뒷전으로 한 티 난다. 당신 실수로 돈 긁음.

당신 Claude Code 습관에서 누가 이득 보나?

Anthropic, 당연히. Max 플랜이 API相当 비용으로 완화되긴 하지만(당신 탭 아님), 패턴은 비효율 외침. 당신이 인프라 보조하며 생산성 쫓는다.

봐, 모든 AI 웨이브 커버했다—Watson, GPT-3, 이제 이거. 허세 없는 진실: 토큰 최적화가 새 devops다. ccwhy가 AI 청구서 SRE다.

당신 분석 공유? 댓글에 “나도 캐시 95%” 쇄도. 정상? 지금은. 하지만 Anthropic PR: “캐시가 마법 가능케 해!” 그래, egress가 클라우드 키웠지.

작은 변화 큰 절감. 0.9% 입력? 프롬프트 더 다듬어. 6.6% 출력? Claude에게 간결하게 유도.

하나 이상 세션: 2~3배 비용, 루프나 나쁜 툴 체인 탓. 규율로 사라짐.

오늘 Claude Code 토큰 낭비 고치기

ccwhy부터. 설치, 돌려, 쳐다봐. 그다음:

  • /compact 필사적으로.
  • Agent 대신 grep.
  • 무거운 작업 오프피크.
  • 툴 출력 요약.

개발자들 20~30% 줄었다고. 혁명 아님—실용적.

회의론자 확인: Claude Code 은총 아님. 프로토타입엔 좋지만, 스케일? 로그 파싱 안 하면 영원히 돈 내.


🧬 관련 인사이트

자주 묻는 질문

Claude Code에서 ccwhy는 뭐 하나?

로컬 ~/.claude/ 데이터 오프라인 파싱, 캐시·입력·출력별 토큰 분해—청구서 왜 높은지 보여줌.

Claude Code 토큰 비용 어떻게 줄이나?

20턴 후 /compact, Agent 대신 grep 검색, 피크 타임 피해, 툴 출력 요약.

Claude Code에서 97% 캐시 읽기 정상인가?

긴 세션에 흔하지만, 최적화 안 하면 예산 다 먹음—Anthropic이 제일 웃음.

Priya Sundaram
Written by

Hardware and infrastructure reporter. Tracks GPU wars, chip design, and the compute economy.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by dev.to