AgentHub: AI 에이전트를 위한 경량 협업 플랫폼과 Autoresearch GPT-2 튜닝 성과
목차
개요
Andrej Karpathy의 Autoresearch 에이전트가 nanochat 프로젝트를 약 2일간 자동 튜닝하여 GPT-2 학습 시간을 11% 단축하는 성과를 달성했습니다. 이 프로젝트에서 영감을 받아 수많은 AI 에이전트들이 동일한 코드베이스에서 협업할 수 있도록 설계된 경량 플랫폼인 AgentHub가 공개되었습니다.
Autoresearch GPT-2 튜닝 결과
주요 성과
Autoresearch 에이전트가 depth=12 모델 기준으로 약 2일간 약 700개의 변경을 자율적으로 시도했습니다. 그 중 검증 손실을 개선하는 약 20개의 유효한 변경사항을 발견했습니다. 결과적으로 “Time to GPT-2” 리더보드 기록이 2.02시간에서 1.80시간으로 단축되었습니다. 약 11%의 개선입니다.
기술적 특징
발견된 변경사항들은 “가산적” 방식으로 작동합니다. depth=12의 소규모 모델에서 발견한 최적화가 depth=24의 더 큰 모델에도 효과적으로 전이되었습니다.
기존의 수동 최적화 워크플로인 아이디어 도출, 구현, 검증, 논문 참고의 순환을 완전히 자동화한 것이 핵심입니다.
향후 “round 2”가 진행될 예정이며, 다수 에이전트 간 협업 방식도 연구 중입니다. 소규모 모델부터 시작하여 점진적으로 확장하는 “에이전트 스웜” 방식이 계획되어 있습니다.
AgentHub 플랫폼
핵심 설계 철학
AgentHub는 GitHub의 인간 중심 구조를 에이전트 중심으로 재구성한 플랫폼입니다. 기존의 메인 브랜치, PR, 머지 방식 대신 DAG 형태의 커밋 그래프로 확장했습니다.
에이전트 간 실험 결과와 가설을 공유하는 게시판 보드를 운영합니다. 플랫폼 자체는 중립적이며, 에이전트의 “문화”는 인스트럭션에서 형성되는 구조입니다.
아키텍처
Go 기반 단일 바이너리로 서버와 CLI로 구성되어 있습니다. SQLite 데이터베이스와 bare git 저장소를 사용합니다. 가볍고 배포가 간편한 것이 특징입니다.
주요 기능
git bundle을 통한 코드 푸시 및 탐색이 가능합니다. 채널, 게시글, 스레드형 메시지 보드로 에이전트 간 소통을 지원합니다. API 키 인증 및 요청 제한 기능을 제공합니다. MIT 라이선스로 공개되어 자유롭게 사용할 수 있습니다.
향후 전망
Autoresearch의 성과는 AI 에이전트가 단순 코드 생성을 넘어 연구 수준의 최적화를 수행할 수 있음을 보여줍니다. AgentHub와 같은 협업 플랫폼이 결합되면 확장된 강화학습 형태의 연구 시스템이 가능해질 것입니다. 에이전트 스웜이 소규모 모델부터 시작해 점진적으로 확장하는 방식은 AGI 달성 전 마지막 난제를 해결하는 접근법이 될 수 있다는 의견도 있습니다.
결론
Karpathy의 Autoresearch가 GPT-2 학습 시간 11% 단축이라는 구체적 성과를 달성하며 자율 연구 에이전트의 가능성을 입증했습니다. AgentHub는 이러한 에이전트들이 대규모로 협업할 수 있는 인프라를 제공합니다. 수동 최적화에서 에이전트 기반 자동 최적화로의 전환이 본격화되고 있습니다.