GPT-5.4의 1M 컨텍스트 윈도우, 기본 설정으로는 258K만 사용 가능

게시 2026/03/12 업데이트 2026/03/12

By Juho

5 분읽는 시간

개요

GPT-5.4가 최대 약 1M 토큰의 컨텍스트 윈도우를 지원한다고 발표되었지만, 실제로 Codex CLI나 IDE에서 사용하면 기본 설정으로는 약 258K 수준의 컨텍스트만 표시되는 현상이 보고되고 있다. Reddit r/codex 커뮤니티에서 이 문제에 대한 논의가 이루어졌으며, config.toml 파일을 직접 수정하여 컨텍스트 윈도우를 확장하는 방법이 공유되었다.

배경

GPT-5.4는 1M 토큰 컨텍스트 윈도우를 지원하는 것으로 발표되었다. 그러나 Reddit r/codex 커뮤니티에서 “GPT-5.4는 1M 컨텍스트를 지원한다고 했는데 왜 258K만 나오나요?”라는 질문이 올라오면서, 기본 설정과 실제 지원 범위 사이의 차이가 주목받기 시작했다. 사용자들이 Codex CLI나 IDE 환경에서 기본 설정 그대로 사용할 경우, 약 258K 수준의 컨텍스트 윈도우만 활용할 수 있었던 것이다.

핵심 내용

문제 현상

GPT-5.4는 최대 약 1M 토큰의 컨텍스트 윈도우를 지원하지만, Codex CLI나 IDE에서 기본 설정으로는 약 258K 수준으로 제한된다. 사용자들이 별도의 설정 변경 없이 사용하면 1M 컨텍스트의 이점을 충분히 활용할 수 없는 상황이었다.

해결 방법

config.toml 파일에 다음 두 가지 설정을 직접 추가하면 약 800K 수준까지 컨텍스트 윈도우를 확장할 수 있다.

  
model_context_window = 800000
model_auto_compact_token_limit = 700000

설정 항목	설명	권장 값
model_context_window	모델이 사용하는 컨텍스트 윈도우 크기	800000
model_auto_compact_token_limit	자동 압축이 시작되는 토큰 한계	700000

model_context_window는 모델이 한 번에 처리할 수 있는 컨텍스트의 크기를 지정한다. model_auto_compact_token_limit는 자동 압축(compaction)이 시작되는 토큰 수의 한계를 설정하는 값이다.

주의사항

최댓값인 1M에 너무 가깝게 설정하면 성능 저하가 발생할 수 있다. 사용자들은 long context를 활용할 때 안정성 문제와 성능 저하 가능성이 있다고 언급하고 있다. Codex의 compaction 기능이 효율적이라는 의견도 있어, 적절한 수준에서 compaction이 동작하도록 설정하는 것이 권장된다.

의미와 시사점

이번 사례는 모델이 지원하는 최대 컨텍스트 윈도우와 도구의 기본 설정 사이에 차이가 있을 수 있다는 점을 보여준다. 모델 스펙상 1M 토큰을 지원하더라도, 실제 도구 환경에서는 안정성과 성능을 고려하여 보수적인 기본값이 설정될 수 있다.

사용자 입장에서는 config.toml 설정을 통해 필요에 맞게 컨텍스트 윈도우를 조절할 수 있다는 점이 유용하다. 다만, 최대치에 가깝게 설정할수록 성능 저하 위험이 있으므로 작업 특성에 맞는 적절한 값을 선택하는 것이 중요하다.

결론

GPT-5.4의 1M 컨텍스트 윈도우는 기본 설정으로는 258K만 활용 가능하지만, config.toml에서 model_context_window와 model_auto_compact_token_limit 값을 조정하면 약 800K 수준까지 확장할 수 있다. 최대치에 가깝게 설정하면 성능 저하가 발생할 수 있으므로, 800K 정도의 수준에서 설정하는 것이 현재 권장되는 방법이다.

LLM