포스트

AI 에이전틱 패턴 4년의 진화: 프롬프트에서 하네스까지

목차

  1. 개요
  2. 세 가지 시대의 진화
  3. 아키텍처 사례 연구
  4. 보안 프레임워크
  5. 결론
  6. Reference

개요

AWS 데이터 사이언티스트 김영민이 정리한 이 글은 2022년부터 2026년까지 AI 개발 패러다임의 세 번의 전환을 기록한다. 핵심 테제는 엔지니어링의 엄밀함은 소멸하지 않고 재배치된다는 것이다. 프롬프트에서 컨텍스트로, 컨텍스트에서 하네스로 엄밀함의 위치가 이동했으며, 이전 시대는 대체가 아닌 포함(subsume) 관계로 발전했다.

세 가지 시대의 진화

프롬프트 엔지니어링 시대 2022-2024

핵심 질문은 무엇을 말해야 하는가였다. 언어 모델을 위한 완벽한 지시를 작성하는 것에 집중한 시기이다.

주요 학술적 성과로 Chain-of-Thought Prompting(Wei et al., 2022)은 let’s think step by step이라는 문구로 수학 벤치마크에서 17.9%를 58.1%로 향상시켰다. ReAct Pattern(Yao et al., 2022)은 추론과 행동을 결합하여 외부 도구 사용을 가능하게 했다. Tree-of-Thought(Yao et al., 2023)은 여러 추론 경로를 동시에 탐색했다. Andrew Ng의 4가지 패턴(2024)은 Reflection, Tool Use, Planning, Multi-Agent Collaboration을 제시했다.

이 시대의 한계는 맹목적 프롬프팅(blind prompting)이었다. 측정 가능한 검증 없이 체계적으로 개선하려 했다. 실제 문제는 프롬프트 품질이 아니라 에이전트가 접근할 수 있는 불완전한 컨텍스트였다.

컨텍스트 엔지니어링 시대 2025

핵심 질문은 어떤 정보를 포함해야 하는가였다. 지시 자체보다 컨텍스트 윈도우를 채우는 데이터가 더 중요하다는 인식이 등장했다.

Anthropic의 WSCI 프레임워크가 핵심이었다. Write는 시스템 프롬프트를 명확하고 명시적으로 구조화하는 것이다. Select는 쿼리당 관련 문서만 검색하여 Lost-in-the-Middle 현상을 해결하는 것이다. Compress는 80% 이상의 정보를 보존하면서 대화 이력을 요약하는 것이다. Isolate는 전문화된 작업을 서브 에이전트에 위임하는 것이다.

핵심 인프라로 KV-캐시 최적화가 주요 프로덕션 메트릭이 되었고, 캐시 히트 시 10배 비용 절감을 달성했다. MCP(Model Context Protocol)는 에이전트-도구 간 통신을 표준화했다. Stable Prefix/Variable Suffix 패턴은 시스템 프롬프트를 고정하고 동적 콘텐츠만 업데이트하는 방식이다.

이 시대의 한계는 완벽한 컨텍스트 구성으로도 시스템적 실패를 극복할 수 없었다는 것이다. 오류 복구 부족, 보안 격차, 오케스트레이션 제어 부재가 여전했다.

하네스 엔지니어링 시대 2026

핵심 질문은 어떤 시스템 아키텍처를 구축해야 하는가이다. 에이전트는 더 나은 입력이 아니라 포괄적인 운영 환경을 필요로 한다는 깨달음이다.

Fowler/Böckeler의 2x2 프레임워크가 이를 정리한다.

구분FeedforwardFeedback
Deterministic가이드 (AGENTS.md 등)계산적 (컴파일러, 린터)
Non-deterministic시스템 프롬프트/지시추론적 (LLM-as-judge 평가)

현재 핵심 지표는 KV-캐시 히트율과 하네스 복잡도로 변경되었다.

아키텍처 사례 연구

Anthropic의 3-Agent 시스템은 에이전트가 정확하게 자기 평가할 수 없다는 근본적 한계를 해결한다. Planner가 간략한 요청을 상세 스펙으로 변환하고, Generator가 자기 평가와 함께 점진적으로 기능을 구현하며, Evaluator가 Playwright를 통해 E2E 테스트를 실행하고 구체적 피드백을 반환한다. 비용은 22배 높지만(200달러 vs 9달러) 훨씬 높은 품질을 생산한다.

OpenAI Codex 프레임워크는 5개월간 100명 이상의 엔지니어가 수작업 코드 0줄로 100만 줄 이상을 생성한 실험이다. 모든 아키텍처 지식을 기계 검증 가능한 규칙으로 체계화했다. 인간 리뷰어를 패턴을 강제하는 커스텀 린터로 대체했다.

Ralph Pattern은 커뮤니티에서 개발한 무인 실행 자율 루프이다. 파일 시스템을 통해 상태를 유지하고, 매 반복마다 컨텍스트를 깨끗하게 리셋하며, 프로그래매틱하게 검증 가능한 유효성 검사를 우선시한다.

보안 프레임워크

Simon Willison의 치명적 삼중주(Lethal Trifecta) 원칙은 다음 세 가지를 인간 승인 없이 동시에 결합하지 말라고 경고한다. 신뢰할 수 없는 입력 처리, 민감한 시스템/데이터에 대한 접근, 상태 변경 능력이다.

Meta의 Rule of Two는 에이전트를 위 세 가지 중 최대 두 가지로 제한하고, 세 가지 모두가 필요할 때는 반드시 인간이 개입하도록 한다.

결론

엔지니어링의 엄밀함은 사라지지 않으며, 점진적으로 더 높은 추상화 수준으로 재배치된다. 프롬프트 시대에는 지시 텍스트의 정밀함에, 컨텍스트 시대에는 정보 윈도우 구성의 품질에, 하네스 시대에는 시스템 전체 아키텍처와 안전장치에 엄밀함이 위치한다. 각 패러다임 전환은 기술적 유행이 아니라 실제 프로덕션 제약을 반영한다. 중심 지표는 주관적 응답 품질에서 정량화된 작업 완료율과 성공당 비용으로 진화했다.

Reference