arXiv, AI 생성 저품질 논문에 1년 제출 금지 - 환각 인용과 챗봇 프롬프트 흔적 차단
목차
개요
arXiv가 검토되지 않은 AI 생성 콘텐츠를 포함한 논문을 제출한 연구자에게 1년 제출 금지를 가하는 공식 정책을 발표했다. 컴퓨터과학 섹션 의장 Thomas Dietterich에 따르면 “검증되지 않은 언어 모델 출력의 명백한 증거”가 있는 논문이 이 정책의 트리거다.
이는 주요 프리프린트 플랫폼이 AI 생성 저품질 작업에 가하는 첫 공식 페널티다. arXiv는 컴퓨터과학, 수학, 물리학 전반에서 프리프린트의 1차 배포 채널이며, 정식 출판 이전에 읽히고 인용되는 경우가 많다.
정책의 구체 내용
정책은 AI 사용 자체를 금지하지 않는다. 연구자는 여전히 언어 모델을 초안 작성과 편집에 사용할 수 있다. 금지는 “저자가 LLM 출력을 검토 없이 붙여넣었다는 증거”가 보이는 경우에 적용된다.
금지를 트리거하는 증거
| 증거 유형 | 설명 |
|---|---|
| 환각된 인용 | 존재하지 않는 출판물을 참고문헌으로 명시 |
| 챗봇 지시 잔존 | “여기에 실제 숫자를 채워주세요” 같은 프롬프트 흔적 |
| 플레이스홀더 데이터 | 검토 없이 남은 더미 값 |
이 정책은 부주의의 명백한 신호를 표적으로 한다. AI 사용 자체가 아니라 검증 부재가 처벌 대상이다.
집행 절차
집행 절차는 다단계다. 모더레이터가 의심스러운 콘텐츠를 식별한 후 섹션 의장이 확인한다. 위반 시 1년 정지가 부과된다. 이후 금지된 연구자는 arXiv에 게시하기 전에 동료심사 저널에 논문을 통과시켜야 한다.
| 절차 | 행위자 |
|---|---|
| 의심 콘텐츠 식별 | 모더레이터 |
| 확인 | 섹션 의장 |
| 정지 기간 | 12개월 |
| 복귀 요건 | 동료심사 저널 통과 |
이 정책은 항소를 허용하고 신뢰할 수 없는 AI 탐지 기술을 요구하지 않는다. 명백한 증거에만 의존한다는 점이 특징이다.
왜 지금 이 정책인가
데이터가 충격적이다. Columbia University 연구는 조작된 인용이 2023년 2,828개 논문당 1건에서 2026년 초 277개 논문당 1건으로 증가했음을 밝혔다. LLM 생성 생의학 참고문헌의 30-69%가 조작된 것으로 나타났다.
| 지표 | 2023년 | 2026년 초 |
|---|---|---|
| 조작된 인용 빈도 | 2,828개 논문당 1건 | 277개 논문당 1건 |
| LLM 생의학 참고문헌 조작률 | - | 30-69% |
이런 수치는 학술 생태계가 임계점에 도달했음을 시사한다. 검증 없이 게시된 AI 콘텐츠가 후속 연구의 참고문헌으로 인용되면서 환각이 학술 기록에 영구화되는 위험이 커지고 있다.
학술 생태계의 더 넓은 맥락
NeurIPS와 ICML 같은 학술 컨퍼런스도 비슷한 도전에 직면해 있다. 저품질 제출물 급증을 보고하고 있다.
새 규칙은 주요 프리프린트 플랫폼이 AI 생성 저품질 작업에 가하는 첫 공식 페널티다. 다만 한계도 명확하다. 동료심사 감독을 요구하는 정교한 부정행위는 잡지 못한다는 점이다.
한국 커뮤니티 GeekNews 논의에서도 AI 생성 콘텐츠 품질이 온라인 공간을 저하시킨다는 우려가 폭넓게 공유된다. 관련 논의는 AI 생성 논문의 환각 인용, arXiv CS 카테고리 제출 관행 업데이트, “AI Slop”이 온라인 커뮤니티에 미치는 영향 등으로 확산되고 있다.
이 정책은 학술 무결성을 유지하기 위한 제도적 노력의 시작점이며, 다른 프리프린트 플랫폼과 학회들이 유사한 정책을 채택할 가능성이 높다.
결론
arXiv의 1년 제출 금지는 “AI 사용 금지”가 아니라 “AI 검증 의무화”의 신호다. 환각된 인용과 챗봇 프롬프트 잔존이라는 두 가지 명백한 부주의 신호가 임계선이다. 조작된 인용이 277개 논문당 1건까지 증가한 현실에서, 이 정책은 학술 기록의 신뢰성을 지키기 위한 최소한의 방어선이다. AI를 사용하되 출력을 검증한다는 원칙은 학술뿐 아니라 모든 전문 작업에 적용되는 새 규범이 되어가고 있다.