GPT-5.6 Sol/Terra/Luna 프리뷰: 새 모델 명명 체계와 사이버 안전 스택
목차
개요
OpenAI가 GPT-5.6 시리즈의 한정 프리뷰를 시작했다. 이번 시리즈는 세 가지 모델로 구성된다. 플래그십 모델인 Sol, 일상 작업을 위한 균형형 모델 Terra, 빠르고 저렴한 모델 Luna다. Terra는 GPT-5.5와 경쟁할 만한 성능을 제공하면서 가격은 2배 저렴하고, Luna는 가장 낮은 비용으로 강력한 역량을 제공한다.
GPT-5.6 Sol은 지금까지 OpenAI가 선보인 가장 견고한 안전 스택과 함께 출시된다. 이번 글에서는 새 명명 체계, 코딩과 생물학, 사이버보안 영역의 성능 개선, 계층형 안전장치, 그리고 가격 정책을 정리한다.
배경
OpenAI는 폭넓은 접근성을 지향하며 GPT-5.6 Sol, Terra, Luna를 향후 몇 주 안에 일반 출시할 계획이다. 다만 이번 출시는 한정 프리뷰로 시작한다.
OpenAI는 미국 정부와의 지속적인 협력의 일환으로, 오늘 출시에 앞서 계획과 모델의 역량을 정부에 미리 공유했다. 정부의 요청에 따라, 더 넓은 범위로 공개하기 전에 참여 사실이 정부와 공유된 소수의 신뢰할 수 있는 파트너 그룹을 대상으로 먼저 프리뷰를 시작한다. OpenAI는 이러한 형태의 정부 접근 절차가 장기적인 기본값이 되어서는 안 된다고 밝혔다.
핵심 내용
새로운 명명 체계와 세 가지 모델
GPT-5.6은 새로운 명명 체계를 도입했다. 숫자는 모델의 세대를 나타내고, Sol, Terra, Luna는 지속적으로 유지되는 역량 계층(capability tier)을 나타낸다.
GPT-5.6과 함께 새로운 max reasoning effort가 도입되어 Sol이 가장 깊이 추론할 수 있는 시간을 확보한다. 또한 새로운 ultra mode가 도입되어, 서브에이전트(subagent)를 활용해 복잡한 작업을 가속함으로써 단일 에이전트의 역량을 넘어선다.
| 모델 | 역할 | 특징 |
|---|---|---|
| Sol | 플래그십 | 가장 강력한 모델, max reasoning effort와 ultra mode 지원 |
| Terra | 균형형 | GPT-5.5와 경쟁할 성능에 2배 저렴한 가격 |
| Luna | 고속/저비용 | 가장 낮은 비용으로 강력한 역량 제공 |
성능과 벤치마크
GPT-5.6 Sol은 OpenAI의 가장 강력한 모델이다. 코딩, 생물학, 사이버보안 영역에서 향상된 에이전트 역량을 보여주는 평가 결과가 공개되었다.
코딩 워크플로의 경우, GPT-5.6 Sol은 Terminal-Bench 2.1에서 새로운 최고 성능(state of the art)을 기록했다. 이 벤치마크는 계획, 반복, 도구 조율이 필요한 커맨드라인 워크플로를 평가한다.
Terminal-Bench 2.1 점수
| 모델 | 점수 |
|---|---|
| GPT-5.6 Sol Ultra | 91.9% |
| GPT-5.6 Sol | 88.8% |
| Claude Mythos 5 | 88.0% |
| GPT-5.6 Terra | 84.3% |
| Claude Fable 5 | 84.3% |
| GPT-5.5 | 83.4% |
| GPT-5.6 Luna | 82.5% |
| Claude Opus 4.8 | 78.9% |
| Gemini 3.1 Pro Preview | 70.7% |
GPT-5.6 Sol은 생물학 워크플로에서도 폭넓은 개선을 보였다. 장기 호흡(long-horizon)의 유전체학 및 정량 생물학 분석을 평가하는 GeneBench v1에서, GPT-5.5보다 더 적은 토큰을 사용하면서도 더 강력한 결과를 달성했다.
사이버 역량과 안전장치
GPT-5.6 Sol은 OpenAI의 모델 중 사이버보안 영역에서 가장 뛰어나다. 취약점 연구와 익스플로잇을 포함한 장기 호흡 보안 작업에서 성능과 효율의 경계를 새롭게 이동시켰다.
ExploitBench에서 GPT-5.6 Sol은 출력 토큰을 약 1/3만 사용하면서도 Mythos Preview와 경쟁할 수준을 보였다. UC 버클리 연구진이 OpenAI 및 다른 프런티어 연구소들과 협력해 만든 벤치마크인 ExploitGym에서는, GPT-5.6 Sol, Terra, Luna 모델 모두 추론량을 늘릴수록 강력한 사이버 역량 개선을 보였다.
OpenAI는 모델이 강력해질수록, 코드 리뷰, 취약점 연구, 패치 개발, 디버깅, 보안 교육, 방어적 테스트 같은 정당한 작업에 대한 접근은 유지하면서, 안전장치가 실제 적대적 압력을 점점 더 잘 견디도록 설계했다고 밝혔다. GPT-5.6 Sol은 엔드투엔드 공격을 안정적으로 수행하기보다는, 사람이 취약점을 찾고 고치도록 돕는 데 더 능하다.
GPT-5.6 Sol은 OpenAI의 Preparedness Framework에서 정의한 Cyber Critical 임계값을 넘지 않는다. Chromium과 Firefox를 대상으로 한 평가에서, 버그와 익스플로잇 프리미티브(익스플로잇의 구성 요소)는 식별했지만, 테스트된 조건에서 완전한 풀체인 익스플로잇을 자율적으로 만들어내지는 못했다.
계층형 안전 스택
GPT-5.6 프리뷰 전반에 걸쳐 계층형 안전장치가 적용된다. 여기에는 모델에 학습된 보호, 생성 중 실시간 검사, 계정 단위 신호, 차등 접근, 모니터링, 집행, 지속적 테스트가 포함된다.
| 계층 | 내용 |
|---|---|
| 학습된 거부 | 탈옥(jailbreak) 시도를 포함해 금지된 사이버 지원을 거부하도록 학습 |
| 실시간 분류기 | 사이버와 생물학 오용 분류기가 출력을 생성 중에 평가, 고위험 사례는 더 큰 추론 모델이 대화를 검토하는 동안 생성을 일시 중단 |
| 계정 단위 검토 | 플래그된 활동은 관련 대화 전반과 위험 신호에 대한 계정 단위 검토를 촉발 |
OpenAI는 여러 프롬프트나 맥락에 걸쳐 작동하는 보편적 탈옥(universal jailbreak)을 찾기 위해, 자동화된 레드팀에 70만 A100 환산 GPU 시간 이상을 투입했다. 또한 인간 전문가 레드팀을 위해 제3자 테스터와도 협업했다.
가격과 프롬프트 캐싱
프리뷰 기간 동안 GPT-5.6 모델은 처음에는 API와 Codex를 통해 선별된 신뢰 파트너 그룹에 제공된다. 가격은 100만 토큰당 책정되며, 세 가지 모델 크기로 나뉜다.
모델별 가격
| 모델 | 입력 (1M 토큰) | 출력 (1M 토큰) |
|---|---|---|
| Sol | 5달러 | 30달러 |
| Terra | 2.50달러 | 15달러 |
| Luna | 1달러 | 6달러 |
GPT-5.6은 더 예측 가능한 프롬프트 캐싱도 도입했다. 명시적 캐시 브레이크포인트(explicit cache breakpoint) 지원과 30분 최소 캐시 수명이 포함된다.
GPT-5.6 및 이후 모델에서는 캐시 쓰기가 모델의 비캐시 입력 단가의 1.25배로 청구된다. 캐시 읽기는 기존과 동일하게 90% 캐시 입력 할인을 계속 적용받는다.
OpenAI는 7월에 Cerebras에서 초당 최대 750토큰의 속도로 GPT-5.6 Sol도 출시한다.
의미와 시사점
이번 발표에서 주목할 점은 명명 체계의 변화다. 세대를 나타내는 숫자와 지속적인 역량 계층을 나타내는 이름(Sol, Terra, Luna)을 분리함으로써, 사용자는 세대가 바뀌어도 자신에게 맞는 역량 등급을 일관되게 선택할 수 있다.
성능 면에서는 효율성이 강조된다. GeneBench v1에서 더 적은 토큰으로 더 나은 결과를 내고, ExploitBench에서 약 1/3 토큰으로 경쟁력을 보인 점은 비용 대비 성능 측면에서 의미가 크다.
사이버 역량이 강해질수록 안전장치도 함께 강화되었다는 점도 핵심이다. 학습된 거부, 실시간 분류기, 계정 단위 검토로 이어지는 계층형 구조와 70만 GPU 시간 규모의 자동 레드팀은, 역량과 안전을 동시에 끌어올리려는 접근을 보여준다. 정부와의 사전 공유 및 한정 프리뷰 절차는 프런티어 모델 배포가 점차 거버넌스 이슈와 맞닿고 있음을 시사한다.
결론
GPT-5.6 시리즈는 Sol, Terra, Luna라는 세 계층으로 역량과 비용을 분리하고, 새로운 명명 체계를 도입했다. GPT-5.6 Sol은 Terminal-Bench 2.1에서 최고 성능을 기록했고, 생물학과 사이버보안 영역에서도 효율적인 개선을 보였다. 강화된 사이버 역량은 계층형 안전 스택과 대규모 자동 레드팀으로 균형을 맞췄다. 프리뷰는 API와 Codex를 통해 신뢰 파트너에게 먼저 제공되며, 일반 출시는 향후 몇 주 내로 예정되어 있다.