Claude Opus 4.6 & Sonnet 4.6 - 1M 컨텍스트 윈도우 정식 출시
목차
개요
Anthropic이 Claude Opus 4.6과 Sonnet 4.6의 완전한 1백만 토큰 컨텍스트 윈도우를 일반 공개(GA)했다. 기존에는 200K 토큰까지만 기본 제공되었으나, 이번 업데이트로 별도의 코드 수정 없이 1M 토큰까지 자동으로 확장된다. Max, Team, Enterprise 사용자에게 자동으로 활성화되며, 추가 비용 없이 표준 가격이 전체 컨텍스트 길이에 동일하게 적용된다.
배경
LLM의 컨텍스트 윈도우는 모델이 한 번에 처리할 수 있는 입력 토큰의 최대 크기를 의미한다. 컨텍스트 윈도우가 클수록 더 많은 정보를 한 번에 입력하여 분석할 수 있어, 대규모 코드베이스 분석이나 장문 문서 처리에서 큰 이점을 가진다. 그동안 200K 토큰을 초과하는 요청은 별도 설정이 필요하거나 제한적으로만 사용 가능했다. 이번 1M 컨텍스트 윈도우 정식 출시로 이러한 제한이 완전히 해소되었다.
핵심 내용
가격 정책
이번 1M 컨텍스트 윈도우 출시에서 가장 주목할 점은 가격 정책이다. 컨텍스트 길이 전체에 걸쳐 표준 가격이 그대로 적용되어, 900K 토큰 요청이 9K 토큰 요청과 동일한 토큰당 요금으로 처리된다.
모델별 가격 비교
| 모델 | 입력 (백만 토큰당) | 출력 (백만 토큰당) |
|---|---|---|
| Opus 4.6 | $5 | $25 |
| Sonnet 4.6 | $3 | $15 |
컨텍스트 길이가 늘어나더라도 토큰당 단가가 변하지 않기 때문에, 대용량 입력에 대한 비용 예측이 매우 명확하다. 이는 기존에 긴 컨텍스트 사용 시 추가 과금이 발생하던 다른 모델들과 차별화되는 부분이다.
주요 기능
1M 컨텍스트 윈도우의 주요 기능은 다음과 같다.
- 200K 토큰을 초과하는 요청이 별도 설정 없이 자동으로 작동한다.
- 처리량 제한(rate limit)이 전체 1M 윈도우에 동일하게 적용된다.
- 미디어 용량이 6배로 증가하여 최대 600개의 이미지 또는 PDF 페이지를 한 번에 처리할 수 있다.
- Claude Code 사용자에게는 1M 컨텍스트가 자동으로 포함된다.
- 기존 코드 수정이 불필요하며, 200K를 초과하는 요청은 자동으로 처리된다.
특히 Claude Code 사용자의 경우, CLAUDE_CODE_DISABLE_1M_CONTEXT 환경 변수를 설정하면 1M 컨텍스트를 비활성화할 수도 있다.
성능 벤치마크
Opus 4.6은 장문맥 벤치마크인 MRCR v2에서 78.3%를 달성했다. 이는 프론티어 모델 중 최고 수준의 정확도이다. 문맥 회수(context recall) 능력이 각 세대마다 지속적으로 개선되고 있으며, 긴 컨텍스트에서도 안정적인 성능을 보여준다.
활용 사례
1M 컨텍스트 윈도우의 대표적인 활용 사례는 다음과 같다.
- 전체 코드베이스를 한 번에 로드하여 분석하고 수정할 수 있다.
- 수천 페이지 분량의 계약서나 법률 문서를 한 번에 검토할 수 있다.
- 장시간 실행되는 에이전트의 완전한 실행 추적(trace)을 로드할 수 있다.
- 이전에 필요했던 손실 있는 요약(lossy summarization)이나 컨텍스트 정리 작업이 더 이상 불필요하다.
의미와 시사점
1M 컨텍스트 윈도우의 정식 출시는 단순한 숫자 확장 이상의 의미를 가진다. 기존에는 긴 문서를 처리하기 위해 청킹(chunking), 요약, RAG(Retrieval-Augmented Generation) 등의 우회 전략이 필요했다. 이제 1M 토큰이면 대부분의 실무 문서를 분할 없이 한 번에 처리할 수 있어, 파이프라인 복잡도가 크게 줄어든다.
또한 가격 정책이 컨텍스트 길이와 무관하게 동일하다는 점은, 긴 입력을 사용하는 애플리케이션의 비용 장벽을 크게 낮춘다. 코드 수정 없이 자동으로 확장되는 점도 개발자 경험 측면에서 큰 개선이다.
Max, Team, Enterprise 플랜 사용자에게 자동 활성화되므로, 해당 플랜을 사용 중이라면 즉시 1M 컨텍스트를 활용할 수 있다.
결론
Anthropic의 Claude Opus 4.6과 Sonnet 4.6의 1M 컨텍스트 윈도우 정식 출시는 LLM 활용 방식에 실질적인 변화를 가져올 수 있는 업데이트이다. 추가 비용 없는 균일 가격, 코드 수정 불필요한 자동 확장, 그리고 MRCR v2 78.3%라는 높은 장문맥 성능은 실무에서 긴 컨텍스트를 적극적으로 활용할 수 있는 기반을 마련해 준다. 대규모 코드베이스 분석, 장문 문서 검토, 에이전트 추적 로그 분석 등 다양한 분야에서 활용이 기대된다.