Better Harness: Evals를 학습 신호로 삼는 하네스 힐 클라이밍
목차 개요 핵심 방법론 6단계 힐 클라이밍 레시피 발견된 하네스 변경 예시 과적합 방지 설계 인프라와 트레이싱 결론 Reference 개요 LangChain의 Better-Harness 접근은 “evals as training data for agents”라는 관점을 취한다. 머신러닝에서 학습 데이터가 모델 개발...
목차 개요 핵심 방법론 6단계 힐 클라이밍 레시피 발견된 하네스 변경 예시 과적합 방지 설계 인프라와 트레이싱 결론 Reference 개요 LangChain의 Better-Harness 접근은 “evals as training data for agents”라는 관점을 취한다. 머신러닝에서 학습 데이터가 모델 개발...
목차 개요 방법론 Entropic Optimal Transport 관점의 어텐션 GOAT 메커니즘 주요 결과 어텐션 싱크 문제 해결 길이 일반화 한계와 주의사항 결론 Reference 개요 “You Need Better Attent...
목차 개요 /goal 명령의 동작 방식 Ralph Loop 개념 내부 프롬프트 템플릿 구조 활성화 방법 커뮤니티 반응 의미와 시사점 결론 개요 Codex CLI 0.128.0 버전에서 /goal 기능이 새롭게 추가되었다. 이 기능은 에이전트가 정해진 목표를 달성할 때까지 자동...
목차 개요 미들웨어란 무엇인가 6개의 라이프사이클 훅 내장 미들웨어 목록 커스터마이징 패턴 구현 방법 결론 Reference 개요 LangChain의 에이전트 미들웨어는 에이전트 코어 루프의 각 단계 전후에 커스텀 로직을 실행할 수 있게 하는 훅 시스템이다. 프롬프트와 도구 정의 같은 기본 커스터마이징은 단순하지...
목차 개요 실험 설계와 결과 세 가지 최적화 레버 핵심 개선 사항 Build & Self-Verify 루프 Context Engineering Loop Detection Reasoning Sandwich Trace Analyzer Skill 실패...
목차 개요 Eval 큐레이션 접근 Eval 분류 체계 메트릭 프레임워크 Trajectory 평가 정확성 평가 방법 구현 인프라 결론 Reference 개요 LangChain은 Deep Agents의 평가에 대해 명확한 입장을 제시한다. “More evals ≠ better agents”이며, 대신 프로덕션에서...
목차 개요 배경 핵심 내용 통합 TTS 엔진과 다국어 지원 기술 스택과 GPU 가속 API와 설치 방법 의미와 시사점 결론 Reference 개요 박재홍이 위키독스에 공개한 Voicebox 소개 글은 클라우드 의존도를 낮춘 로컬 우선 음성 합성 도구를 소개한다. V...
목차 개요 하네스란 무엇인가 핵심 구성 요소 파일시스템과 영속 저장소 Bash와 코드 실행 샌드박스와 실행 환경 메모리와 검색 컨텍스트 관리 장기 실행 능력 모델과 하네스의 공진화 의미와 시사점 결론 Reference 개요 Lan...