포스트

스킬과 하네스: 에이전트의 정책과 피드백 루프

목차

  1. 개요
  2. 개념의 구분
  3. 둘이 겹치는 이유
  4. 에이전트 런타임과 장기 실행
  5. 결론
  6. Reference

개요

AI 에이전트를 설계할 때 자주 등장하는 두 개념이 스킬(skill)과 하네스(harness)다. 개념상으로는 분명히 구분되지만, 실제 구현체에서는 둘의 경계가 자주 겹친다. Jaesol Shin의 글 “스킬과 하네스”는 이 둘의 관계를 정리하며, 왜 개념적으로는 다른데 구현에서는 서로를 품게 되는지를 설명한다.

저자의 핵심 정의는 다음과 같다. 스킬은 에이전트의 정책을 표현하며, 하네스는 그 정책이 목적을 향해 탐색되도록 가두는 피드백 구조다.

개념의 구분

스킬과 하네스는 각각 “어떻게 행동할 것인가”와 “그 행동이 목표에 가까워졌는지 어떻게 알 것인가”를 다룬다.

스킬이란 무엇인가

스킬은 능력의 패키지다. 에이전트가 무엇을 할 수 있는지, 어떤 방식으로 행동하는지를 압축한 단위다.

스킬은 단순한 프롬프트를 넘어선다. 도구 호출 방식, 서브에이전트 사용 규칙, 스크립트와 검증 명령, 출력 형식과 금지 조건을 모두 포함할 수 있다. 이전에 프롬프트가 맡던 역할을 파일시스템, 도구, 실행 환경까지 확장한 형태다.

저자는 스킬이 두 가지 성질을 동시에 가진다고 본다.

성질설명
개념으로서의 스킬업무 능력과 패턴을 패키징하는 발상
구현으로서의 스킬SKILL.md, 훅, 스크립트로 구체화된 산출물

이 구분 덕분에 스킬은 표준화된 형식을 따르면서도 하네스의 특성을 담을 수 있다.

하네스란 무엇인가

하네스는 피드백 루프다. 능력 자체를 정의하기보다, 그 능력이 놓이는 탐색 공간과 결과를 거르는 평가 조건을 정의한다.

하네스는 구체적으로 다음을 정한다.

  • 무엇을 바꿀 수 있고 무엇은 바꿀 수 없는지
  • 성공과 실패를 어떻게 판정하는지
  • 실패했을 때 어떻게 복구하는지

중요한 통찰은 하네스의 강도가 크기에서 오지 않는다는 점이다. 하네스의 강도는 피드백 신호의 명료함에서 온다. 출력에 이모지가 섞이면 파일 쓰기를 막아버리는 훅은 코드 몇 줄에 불과하지만, 명확한 이진 판단을 내리는 강력한 미니 하네스다.

둘이 겹치는 이유

도구, 스킬, 하네스는 아래에서 위로 쌓인 층으로 볼 수 있다. 도구는 단일 행위, 스킬은 정책 단위, 하네스는 피드백 구조다. 도구가 스킬에 담기고, 스킬이 하네스 안에서 작동한다.

스킬 안에 내장된 미니 하네스

스킬은 능력 패키지이지만 내부적으로 작은 하네스를 포함할 수 있다. 예를 들어 배포 스킬이 테스트 실행, 로그 확인, 헬스체크, 롤백 조건을 포함하면 그 자체로 하나의 제어 시스템이 된다. 테스트 실패, 타입 오류, 빌드 로그, 실행 결과가 모두 피드백 신호가 되기 때문이다.

하네스가 스킬 형태로 배포되는 이유

반대 방향의 겹침도 일어난다. 전체 하네스는 목표, 상태, 평가, 권한, 복구를 포함하므로 그대로 이식하기 어렵다. 반면 스킬은 문서, 훅, 커맨드, 스크립트의 묶음으로 배포하기 쉽다.

여기에 표준화의 비대칭성이 있다. 스킬은 표준화된 로드 단위라 런타임에 그대로 끼워 넣을 수 있지만, 하네스에는 그런 표준층이 없다. 그래서 하네스를 에이전트에 얹는 가장 실용적인 방식이 결국 스킬 형식을 빌리는 것이 된다.

에이전트 런타임과 장기 실행

Claude Code 같은 시스템은 세 가지 역할을 동시에 수행한다.

역할설명
에이전트 런타임파일시스템, 셸, 테스트를 연결
스킬 실행기코드 읽기, 수정, 디버깅 같은 내장 스킬 보유
하네스화된 실행 환경수정-실행-관찰을 반복하는 환경

저자는 명확한 목표와 피드백만 있으면, 정책을 명시적으로 제공하지 않아도 내장된 능력만으로 뛰어난 성능을 낼 수 있다고 본다.

다만 장기 실행 에이전트에서는 차이가 분명해진다. 며칠 또는 몇 주에 걸친 목표 추구, 세션 간 상태 유지, 다중 에이전트 협업은 단일 스킬로 감당하기 어렵다. 이 지점에서 하네스는 여러 스킬을 통합하는 상위 오케스트레이션, 즉 전체 시스템이 된다.

결론

스킬과 하네스는 배타적인 개념이 아니다. 스킬은 정책을 압축한 실행 단위이고, 하네스는 그 정책이 탐색되고 검증되는 피드백 환경이다.

개념상으로는 차이가 있지만 구현체에서는 스킬이 하네스를 내장하고, 하네스가 스킬 형태로 배포된다. 이렇게 겹칠 수 있는 이유는 둘이 프로토콜이 아니라 개념이기 때문이다. 프로토콜의 명세는 배타적이지만, 개념은 강조점으로 갈리면서도 외연을 공유한다.

Reference