Claude Fable 5 & Mythos 5 접근 중단 - 미국 정부 수출 통제 지시
목차
개요
2026년 6월 12일, Anthropic은 미국 정부의 수출 통제 지시에 따라 Claude Fable 5와 Claude Mythos 5 모델에 대한 접근을 전 세계적으로 중단했다는 성명을 발표했다. 이는 두 모델의 출시 직후 발생한 조치로, 모델의 성능이나 기능이 아닌 접근 자체가 중단되었다는 점에서 주목된다. 정부는 국가 안보 권한을 근거로 들었으며, 해당 지시는 외국 국적자를 포함한 모든 사용자에게 적용된다. 다른 Anthropic 모델들은 이번 조치의 영향을 받지 않는다.
수출 통제 지시의 내용
Anthropic은 미국 동부시간 기준 오후 5시 21분에 해당 지시를 받았으며, 처음에는 구두로 전달되었다고 밝혔다. 정부가 보낸 서신에는 국가 안보 우려에 대한 구체적인 세부 사항이 명시되지 않았다. 규정 준수를 위해 Anthropic은 Fable 5와 Mythos 5 두 모델을 모든 고객에 대해 비활성화해야 했다.
영향 범위
이번 지시는 미국 내부 또는 외부에 있는 모든 외국 국적자에게 적용된다. 여기에는 외국 국적의 Anthropic 직원도 포함된다. 규정 준수의 실효성을 확보하기 위해 결과적으로 모든 고객에 대해 두 모델이 비활성화되었다.
다음 표는 영향 범위를 정리한 것이다.
| 구분 | 내용 |
|---|---|
| 접근 중단 모델 | Fable 5, Mythos 5 |
| 영향받지 않는 모델 | 그 외 모든 Anthropic 모델 |
| 적용 대상 | 미국 내외의 모든 외국 국적자, 외국 국적 직원 포함 |
| 실제 조치 | 모든 고객 대상 두 모델 비활성화 |
정부가 제시한 우려
Anthropic에 따르면 정부는 Fable 5를 우회하거나 탈옥하는 방법을 인지하게 되었다. 시연된 내용은 모델에게 특정 코드베이스를 읽고 소프트웨어 결함을 수정하도록 요청하는 방식이었다. Anthropic은 이를 검토한 결과 소수의 이미 알려진 사소한 취약점을 발견했다고 밝혔다. 이 취약점들은 비교적 단순하며, 공개적으로 이용 가능한 다른 모델들도 동일하게 발견할 수 있는 수준이라고 평가했다. Anthropic은 이를 좁은 범위의 잠재적 탈옥으로 규정하면서, Mythos 고유의 추가적 능력을 제공하지 않는 사소한 발견이라고 설명했다.
Anthropic의 방어 입장
Anthropic은 정부의 조치에 대해 여러 근거를 들어 반박했다.
- 사이버보안 태스크에 대한 강력한 안전 장치가 오용 가능성을 낮춘다
- 정부 및 제3자 기관과 함께 광범위한 레드팀 테스트를 수행했다
- Fable의 안전 장치는 이전에 배포된 어떤 모델보다도 실질적으로 더 효과적이다
- 범용 탈옥은 발견되지 않았다
- 완벽한 탈옥 저항은 현재 어떤 모델 제공업체도 달성할 수 없다
심층 방어 전략
Anthropic은 완벽한 탈옥 저항이 현재 어떤 모델 제공업체에게도 불가능하다는 전제에서 심층 방어 전략을 채택했다고 밝혔다. 이 전략은 탈옥을 좁은 범위에 한정하거나 매우 비싼 비용을 들여야만 생성할 수 있도록 만드는 것을 목표로 한다. 여기에 철저한 모니터링을 결합해 성공적인 공격을 신속하게 탐지하고 차단한다. Anthropic은 이 전략이 Fable이 야기하는 위험을 낮춰 이미 배포된 기존 모델들의 위험 수준과 비슷하게 만든다고 주장했다.
데이터 보유 정책
Anthropic은 Fable에 대해 고객 데이터의 30일 보유를 요구했다. 이는 연구를 수행하고 탈옥을 완화하기 위해 도입된 정책이다. 회사는 이 정책 변경이 고객과의 관계에서 실질적인 비용을 수반한다고 설명했다.
절차에 대한 이견
Anthropic은 정부가 안전하지 않은 배포를 차단할 수 있는 권한을 가져야 한다는 점에는 동의한다. 다만 그 권한은 투명하고 공정하며 명확하고 기술적 사실에 근거한 법적 절차의 일부여야 한다고 강조했다. 회사는 이번 조치가 그러한 원칙을 따르지 않았다고 평가했다. 나아가 만약 동일한 기준이 업계 전반에 적용된다면, 모든 프런티어 모델 제공업체의 신규 모델 배포가 사실상 전면 중단될 것이라고 주장했다.
향후 일정
Anthropic은 규정 준수를 위해 즉시 모든 사용자에 대해 두 모델을 비활성화했다. 이후 24시간에 걸쳐 더 많은 세부 사항을 공유하겠다고 밝혔다. 또한 가능한 한 빨리 접근을 복원하기 위해 노력하고 있다고 덧붙였다.
결론
이번 사례는 프런티어 AI 모델의 출시와 접근 가능성이 기술적 역량뿐 아니라 규제와 국가 안보 판단에 의해서도 좌우될 수 있음을 보여준다. Anthropic은 모델의 안전 장치가 충분히 효과적이며 시연된 취약점이 사소한 수준이라고 반박하면서, 정부 조치가 투명하고 기술적 사실에 근거한 절차를 따르지 않았다고 주장했다. 동시에 회사는 정부의 배포 차단 권한 자체는 인정하면서 절차적 정당성을 문제 삼는 균형 잡힌 입장을 취했다. 접근 복원 여부와 향후 규제 방향은 프런티어 모델 배포 전반에 중요한 선례가 될 것으로 보인다.