포스트

Claude 90% 할인 중국 암시장의 정체와 AI 데이터 탈취 위험

목차

  1. 개요
  2. 암시장 유통 구조
  3. 데이터 탈취 메커니즘
  4. 의미와 시사점
  5. 결론
  6. Reference

개요

Anthropic의 생성형 AI 모델 Claude가 중국 암시장에서 공식 가격의 10% 수준으로 유통되고 있다. 김미디어저널은 이 흐름이 단순한 불법 판매가 아니라 사용자 데이터 탈취의 통로라고 지적한다. 프록시 서비스 운영자들이 사용자의 프롬프트와 답변, 추론 과정을 수집해 학습용 데이터셋으로 재가공하기 때문이다. 독일 CISPA 연구팀의 분석에 따르면 동일 의료 벤치마크에서 공식 API는 84%의 정답률을 보였으나 프록시 서비스는 37%에 그쳤다. 저렴해 보이는 가격표 뒤에 성능 저하와 데이터 유출이 동시에 따라오는 구조다.

암시장 유통 구조

암시장 판매자는 정상 결제 경로를 우회해 Claude API를 대량으로 확보한다. 이렇게 확보된 API는 다시 여러 사용자에게 쪼개져 재판매된다.

계정 우회 판매 방식

판매 방식은 크게 네 가지가 보고되었다. 첫째, 무료 체험 계정을 대량으로 만들어 받은 크레딧만 추출해 API로 재판매한다. 둘째, 도난 신용카드를 사용해 유료 플랜에 가입한 뒤 계정을 통째로 넘긴다. 셋째, 월 200달러짜리 Max 요금제를 여러 사용자에게 분할해 판매한다. 넷째, 사용자에게는 고급 모델인 Claude Opus를 제공한다고 표시한 뒤 실제로는 저가 모델인 Haiku의 응답을 반환한다.

성능 저하 사례

가격이 10분의 1로 떨어지면 그에 상응하는 품질 저하가 따라온다. CISPA 연구팀이 의료 벤치마크에서 측정한 결과는 그 격차를 정량적으로 보여준다.

항목공식 API프록시 서비스
의료 벤치마크 정답률84%37%
광고 모델표시된 모델 그대로Opus 표시, Haiku 응답
데이터 보호Anthropic 정책 적용검증되지 않음

37%라는 수치는 단순한 잡음이 아니라 실제 사용자가 받는 답변의 신뢰도가 절반에 못 미친다는 의미다.

데이터 탈취 메커니즘

암시장 프록시의 진짜 문제는 가격 차이가 아니라 데이터 흐름이다. 사용자가 입력하는 모든 정보가 프록시 운영자의 서버를 통과한다.

수집되는 정보의 종류

프록시 운영자들은 사용자가 보낸 프롬프트, 모델이 반환한 답변, 그리고 사고 과정에 해당하는 추론 트레이스를 함께 저장한다. 이 세 가지가 묶이면 사실상 완성된 학습용 데이터셋이 된다. 질문과 답변의 짝, 추론 단계의 중간 결과까지 포함되어 있어 다른 모델의 사전·사후 학습 자료로 곧바로 활용될 수 있다. 김미디어저널은 이 데이터가 중국 AI 모델의 성능 향상에 활용된다고 지적한다.

기업 기밀 유출 위험

기업 개발자가 프록시 서비스를 거치면 위험은 한층 커진다. 소스코드, API 구조, 내부 인증 정보가 프롬프트에 포함되는 경우가 흔하기 때문이다. 이 정보들은 별다른 통제 없이 프록시 운영자의 데이터베이스에 저장된다. 옥스포드 중국 정책 연구소의 질란 첸 연구원은 “검증되지 않은 프록시를 통해 AI 서비스를 사용하는 것은 사실상 기밀 데이터를 제3자 서버에 보내는 것과 같다”고 경고한다. 한 번 빠져나간 데이터는 회수가 불가능하다는 점에서 가격 절감보다 훨씬 큰 비용을 치를 수 있다.

의미와 시사점

저가 프록시는 LLM 생태계의 그림자 같은 구조를 드러낸다. 모델 자체가 강력해질수록 우회 경로의 인센티브도 함께 커지고, 그 인센티브는 학습 데이터 수집이라는 또 다른 목적과 결합한다. 개인 사용자는 답변 품질이 떨어진다는 점만 체감하기 쉽지만, 실제 비용은 답변 뒤에서 일어나는 데이터 흐름에 있다. 기업 입장에서는 비용 절감 목적의 외부 API 사용 시 출처와 라우팅 경로를 반드시 확인해야 한다. 공식 채널 외의 API 사용은 약관 위반에 더해 영업 비밀 유출, 컴플라이언스 위반, 모델 응답 위조까지 동시에 떠안는 셈이다.

결론

Claude 암시장 가격표는 단순한 할인이 아니라 데이터 거래의 다른 이름이다. 공식 API와 프록시 서비스 사이의 정답률 격차는 47%포인트에 달했고, 사용자 프롬프트와 추론 과정은 학습용 데이터셋으로 재가공되고 있다. 가격이 비정상적으로 낮은 AI 서비스가 보이면 우선 라우팅 경로를 의심하는 것이 안전하다. 모델을 쓰는 비용보다 데이터를 잃는 비용이 훨씬 크기 때문이다.

Reference