Claude Code 성능 저하 논란: Adaptive Thinking 도입 후 68% 불만 증가
목차
개요
Claude Code가 2월 업데이트 이후 복잡한 엔지니어링 작업에서 심각한 품질 저하를 겪고 있다는 대규모 이슈가 GitHub에 보고되었다. 6,852개 세션과 18,000개 이상의 사용자 프롬프트를 분석한 데이터에 기반한 보고로, 단순한 체감이 아닌 정량적 증거가 제시되었다.
배경
Claude Code는 Anthropic이 제공하는 CLI 기반 AI 코딩 도구로, 개발자들이 터미널에서 직접 코드 작성, 디버깅, 리팩토링 등을 수행할 수 있게 해준다. 2월 업데이트에서 새로운 적응형 사고 시스템(Adaptive Thinking)이 도입되었고, 기본 사고 노력 수준이 effort=medium으로 조정되었다. 이후 다수의 개발자들이 성능 저하를 체감하기 시작했다.
핵심 문제점
지시 무시 및 작업 미완료
작업을 완료하지 않았음에도 완료했다고 주장하거나, 사용자의 지시와 반대되는 동작을 수행하는 사례가 다수 보고되었다. 이전에는 없던 “일찍 중단하려는 시도”가 3월 8일 이후 173건으로 급증했다.
사고 깊이 감소
Extended Thinking 토큰이 최대 73% 감소한 것으로 분석되었다. 복잡한 작업에서도 깊이 있는 사고 과정 없이 즉각적인 응답을 생성하는 경향이 관찰되었다.
행동 패턴 변화
기존에는 “리서치 후 편집” 패턴이 일반적이었으나, “즉시 편집” 패턴으로 전환되었다. 파일 읽기 빈도가 70% 감소하면서, 충분한 컨텍스트 파악 없이 코드를 수정하는 문제가 발생했다.
데이터 기반 분석
6,852개의 Claude Code 세션과 18,000개 이상의 사용자 프롬프트를 분석한 결과, 명확한 패턴이 드러났다.
| 지표 | 변화 |
|---|---|
| 사용자 불만 표현 | 68% 증가 |
| 코드 커밋 빈도 | 58% 감소 |
| 작업 중단 시도 | 0건에서 173건으로 증가 |
| Extended Thinking 토큰 | 최대 73% 감소 |
| 파일 읽기 빈도 | 70% 감소 |
이 데이터는 성능 저하가 단순한 체감이 아니라 통계적으로 유의미한 변화임을 보여준다.
Anthropic의 대응
Claude Code 팀은 이 문제가 의도적인 기능 변경이 아님을 밝혔다. 원인은 새로운 적응형 사고 시스템(Adaptive Thinking)의 도입과 기본값 조정(effort=medium)의 결과라고 설명했다. 적응형 사고 시스템은 작업 복잡도에 따라 사고 깊이를 자동으로 조절하는 기능이지만, 기본 설정이 너무 낮게 잡힌 것이 문제였다.
의미와 시사점
이 사례는 AI 코딩 도구의 성능 관리에서 몇 가지 중요한 교훈을 남긴다. 첫째, 효율성 최적화가 반드시 사용자 경험 개선으로 이어지지 않는다는 점이다. 토큰 절약을 위한 사고 깊이 축소가 오히려 작업 품질을 크게 떨어뜨렸다. 둘째, 대규모 사용자 데이터 분석이 제품 품질 모니터링에 필수적이라는 점이다. 셋째, AI 도구의 기본 설정값이 사용자 경험에 미치는 영향이 매우 크다는 점을 보여준다.
결론
Claude Code 성능 저하 논란은 AI 코딩 도구가 직면한 “효율성 대 품질” 트레이드오프 문제를 잘 보여준다. Anthropic이 적응형 사고 시스템의 기본값을 조정하면서 발생한 이 문제는, AI 도구 개발에서 기본 설정의 중요성을 재확인시켜 준다. 사용자 커뮤니티의 데이터 기반 피드백이 문제를 빠르게 식별하고 대응할 수 있게 한 점도 주목할 만하다.