책상 위 커피 식어버린 채 ~/.claude/ 파싱 로그 보던 중이었다—바로 그때 봤다: 187세션, 33억 토큰, 6744달러 날린 거.
Claude Code 토큰 사용은 생각한 거랑 완전 다르다. 우리 모두 그랬지, Anthropic 코딩 에이전트로 봇이나 자동화, 사이드 프로젝트 만들 때 효율적인 마법이라고 믿었잖아. 그런데 이 깊이 분석—Rust CLI ccwhy로 만든 거—뚜껑 제대로 열었다.
20년째 밸리 하이프 사이클 지켜본 냉소적 진실: Anthropic이 캐시 읽기로 돈 쓸어 담고, 당신은 파산 피하려 습관 고치느라 정신없다.
Claude Code 토큰 청구서가 슬쩍 다가오는 이유
97% 캐시 읽기. 매 턴마다 Claude가 대화 컨텍스트 전체 다시 읽는다—한 문단 쓰고 《전쟁과 평화》 첫 페이지로 돌아가는 꼴. 캐시는 싸긴 하다, 백만 토큰당 1.5달러지만 압도적이다.
제어 가능한 부분? 고작 2.8%. 세부: 92.5% 캐시 생성(CLAUDE.md 파일, MCP 툴, 시스템 프롬프트), 6.6% Claude 출력, 0.9% 당신 입력. 당신 몫은 그게 다다.
지난 한 달간 Claude Code 엄청 썼다. 트레이딩 봇, 자동화 툴, 사이드 프로젝트 만들면서. 토큰 많이 쓴다는 건 알았지만 숫자까지는 안 봤다.
이 개발자도 그랬다, CLI 돌리기 전까지. 이제 오픈소스—brew install SingggggYee/tap/ccwhy나 cargo install. 오프라인, 키 필요 없음. ccusage처럼 얼마 썼는지가 아니라 왜 썼는지 알려준다.
피크 타임(월~금 오전 5~11시 PT)에 1.3배 토큰 더 썼다. Bash 툴? 호출 40%, 긴 출력 전체 다시 채움. 서브에이전트? 840회 호출, 바보 같은 검색 위해 컨텍스트 전체 복제.
86세션이 /compact 없이 30턴 넘기며 컨텍스트 2~3배 부풀음. 35개 이상 징후, 2~3배 비용. 익숙하지?
Claude Code에서 97% 캐시 읽기가 정상인가?
헤비 유저에겐 그럴 수 있다. 지속 가능할까? 닷컴 버블 때 독특한 관점: AWS 초기 데이터 전송 비용 기억나? EC2로 제국 세우다 egress 비용에 털린 개발자들. Claude 캐시가 지금 숨은 세금—Anthropic은 당신이 ~/.claude/ 안 파싱하길 바란다.
예언: 1년 내 스마트 컨텍스트 압축 내놓거나, 유저들이 Llama 같은 오픈 모델로 도망친다. 누가 진짜 이기나? 청구서 보며 멍 때리는 당신 아님.
분석 후 고친 거 효과 봤다. 20턴 후 /compact. Agent 버리고 코드베이스에 grep/glob. 무거운 작업 오프피크로. 이상 징후 싹 사라짐.
좀 빙 둘러보자—이런 툴 전에 봤다. 2010년 heroku logs가 dyno sleep 낭비 드러냈고, 개발자들이 스크립트로 우회. 같은 느낌. Claude Code 강력하지만, 제대로 안 보면 날것이다.
Bash 독주? 잔인하다. 명령 출력 전체 파이프—왜? 툴은 요약해야지, 토해 내지 말고. 서브에이전트 컨텍스트 복제? 아마추어 수준. Anthropic이 속도 우선, 똑똑함은 뒷전으로 한 티 난다. 당신 실수로 돈 긁음.
당신 Claude Code 습관에서 누가 이득 보나?
Anthropic, 당연히. Max 플랜이 API相当 비용으로 완화되긴 하지만(당신 탭 아님), 패턴은 비효율 외침. 당신이 인프라 보조하며 생산성 쫓는다.
봐, 모든 AI 웨이브 커버했다—Watson, GPT-3, 이제 이거. 허세 없는 진실: 토큰 최적화가 새 devops다. ccwhy가 AI 청구서 SRE다.
당신 분석 공유? 댓글에 “나도 캐시 95%” 쇄도. 정상? 지금은. 하지만 Anthropic PR: “캐시가 마법 가능케 해!” 그래, egress가 클라우드 키웠지.
작은 변화 큰 절감. 0.9% 입력? 프롬프트 더 다듬어. 6.6% 출력? Claude에게 간결하게 유도.
하나 이상 세션: 2~3배 비용, 루프나 나쁜 툴 체인 탓. 규율로 사라짐.
오늘 Claude Code 토큰 낭비 고치기
ccwhy부터. 설치, 돌려, 쳐다봐. 그다음:
- /compact 필사적으로.
- Agent 대신 grep.
- 무거운 작업 오프피크.
- 툴 출력 요약.
개발자들 20~30% 줄었다고. 혁명 아님—실용적.
회의론자 확인: Claude Code 은총 아님. 프로토타입엔 좋지만, 스케일? 로그 파싱 안 하면 영원히 돈 내.
🧬 관련 인사이트
- 더 읽기: Philosophy Can’t Breathe a Soul into AI’s Cold Calculations
- 더 읽기: Browser Tools That Let You Build Manga Without Dropping $50 on Software
자주 묻는 질문
Claude Code에서 ccwhy는 뭐 하나?
로컬 ~/.claude/ 데이터 오프라인 파싱, 캐시·입력·출력별 토큰 분해—청구서 왜 높은지 보여줌.
Claude Code 토큰 비용 어떻게 줄이나?
20턴 후 /compact, Agent 대신 grep 검색, 피크 타임 피해, 툴 출력 요약.
Claude Code에서 97% 캐시 읽기 정상인가?
긴 세션에 흔하지만, 최적화 안 하면 예산 다 먹음—Anthropic이 제일 웃음.