Agent 197
- Agentic Code Review : 작성은 저렴해지고 검증이 병목이 된 시대
- re_gent : AI 코딩 에이전트 활동을 추적하는 버전 관리 시스템
- OpenAI Codex : 레이트 리밋 리셋을 저장해 원할 때 사용하기
- OpenPipe ART: 경험으로 학습하는 에이전트 강화학습 트레이너
- Open Code Review : 알리바바의 오픈소스 AI 코드 리뷰 CLI
- Codex Record & Replay : 워크플로우를 시연해 재사용 스킬로 만들기
- Headroom: AI 에이전트를 위한 컨텍스트 압축 레이어
- From AGI to ASI: 초지능으로 가는 네 갈래 경로와 병목 분석
- 16개의 Claude 에이전트가 C 컴파일러를 만들다: 멀티 에이전트 개발 실험
- Agent Deck: 여러 AI 코딩 에이전트를 통합 관리하는 터미널 커맨드 센터
- Agent Skills: Addy Osmani가 정리한 AI 코딩 에이전트 워크플로우 모음
- 자가진화 LLM 에이전트의 능력 붕괴: 경험 내재화를 다시 생각하다
- SIA: 하네스와 가중치를 동시에 업데이트하는 자기 개선 AI 시스템
- 하네스 엔지니어링: 에이전트 우선 세계에서 Codex 활용하기
- Darwin Gödel Machine: 자기 개선 에이전트의 개방형 진화
- Self-Harness: LLM 에이전트가 스스로 실행 환경을 개선하는 프레임워크
- Hermes Agent Self-Evolution: DSPy+GEPA로 에이전트 스킬·프롬프트를 자동 진화시키는 파이프라인
- Agentopia: 에이전트 사회에서의 장기 생활 시뮬레이션과 학습
- 2026년 에이전틱 애플리케이션 구축을 위한 주요 프레임워크 비교
- LangGraph 기반 차세대 Agentic RAG (2026 에디션)
- 루프 엔지니어링: AI 에이전트를 직접 프롬프트하는 시대에서 루프를 설계하는 시대로
- Long-Running Agents: 장시간 실행 에이전트의 아키텍처와 설계 패턴
- Claude Code Auto Mode: 승인 피로 없는 안전한 자동 권한 시스템
- Microsoft Scout - 상시 작동하는 개인 AI 에이전트
- Meta-Agent Challenge: 에이전트가 에이전트를 만들 수 있는가
- Hermes Agent: 모든 메신저에 붙는 Nous Research의 AI 데스크톱
- Odysseus: 내 하드웨어에서 돌리는 셀프호스팅 AI 워크스페이스
- Claude Code 피드백 루프: 에이전트가 스스로 검증하게 만들기
- Andrej Karpathy의 CLAUDE.md: 코딩 에이전트 워크플로 원칙
- Google DeepMind Science Skills: 과학 연구를 위한 에이전트 스킬 모음
- 장기 에이전트 작업의 교차 벤치마크 일반화
- TaskMem: 멀티모달 에이전트를 위한 작업 중심 기억 학습
- OpenAI 프런티어 모델과 Codex, 이제 AWS에서 쓴다
- A Harness for Every Task: Claude Code의 동적 워크플로우
- AgingBench: 배포된 AI 에이전트는 시간이 지나면 늙는다
- Codex Sites: 프롬프트에서 호스팅 사이트까지, OpenAI의 배포 플러그인
- Agent Executor (AX): Google이 공개한 분산 에이전트 런타임
- How We Contain Claude: 제품별 에이전트 격리(Containment) 패턴 해부
- 메타엔지니어링 하네스: 계약 기반 적대적 검증으로 만드는 AI 네이티브 소프트웨어 생산
- 에이전트 워크플로를 LLM 가중치로 컴파일하기: 100배 저렴한 지하 에이전트
- LLM 에이전트가 직접 학습 데이터를 만든다: 자율 에이전트 데이터 엔지니어링
- When AI builds itself: 재귀적 자기개선을 향한 Anthropic의 현주소
- 스킬과 하네스: 에이전트의 정책과 피드백 루프
- Claude Opus 4.8: 정직성, 동적 워크플로우, 노력 제어
- AutoResearch - 과학 연구 자동화의 5단계 자율성 스펙트럼(L0-L4) 서베이
- Anthropic Cybersecurity Skills - AI 에이전트용 754개 사이버보안 스킬 저장소
- Free Claude Code - Claude Code를 17개 AI 제공자로 라우팅하는 오픈소스 프록시
- METR 프런티어 위험 보고서 - 내부 AI 에이전트의 오정렬 위험을 평가하다
- Code as Agent Harness - 코드를 에이전트의 실행·검증·상태 기반으로 재정의한 서베이
- 하네스 엔지니어링 배우기 - 신뢰할 수 있는 AI 코딩 에이전트를 만드는 5개 서브시스템
- Anthropic, SDK·MCP 서버 도구 기업 Stainless 인수 - 에이전트 연결성 강화
- OpenAI Harness Engineering: 인간이 한 줄도 안 쓴 100만 줄짜리 제품, Codex 가 어떻게 만들었나
- Cloudflare Skills - Workers와 Agents SDK 개발을 위한 에이전트 스킬 모음
- SpecGuard - AI 코딩 전 명세를 검증하는 Validation-First Workflow 도구
- Agentic Memory 4가지 유형 해부: 컨텍스트, 외부, 에피소딕, 파라메트릭 메모리 설계
- 대규모 코드베이스에서 Claude Code 작동 방식 - 하네스, CLAUDE.md, Skill, LSP 모범 사례
- Eugene Yan의 AI 협업 5가지 원칙 - 컨텍스트, 설정, 검증, 위임, 피드백 루프
- OpenAI Codex Mobile - ChatGPT 앱에서 데스크톱 코딩 에이전트를 원격 관리
- Microsoft MDASH - 100개 이상의 AI 에이전트로 사이버짐 1위, 앤트로픽 미토스를 능가하다
- DeepSeek-TUI - 터미널에서 실행되는 DeepSeek V4 코딩 에이전트
- Qwen3.7-Max 공개: 에이전트 시대를 겨냥한 알리바바의 프런티어 모델
- Cohere Command A+ 공개: W4A4 양자화로 단일 GPU에서 돌아가는 218B MoE 모델
- Code as Agent Harness: 코드를 에이전트 실행 기반으로 보는 새로운 관점 (서베이)
- Claude 유료 플랜의 프로그래매틱 크레딧 분리 - Agent SDK와 claude -p가 별도 한도로
- Claude Code Superpowers 플러그인 - AI에게 코드보다 기획서를 먼저 쓰게 하기
- Andrej Karpathy Skills - LLM 코딩 함정을 줄이는 Claude Code 플러그인
- Code with Claude SF 컨퍼런스 정리 - 19개 세션이 보여준 Anthropic의 차세대 개발 청사진
- AI Agent Complexity Ratchet — 90% 테스트 커버리지가 AI 코딩의 새 표준이 된 이유
- Claude Code /goal - 조건이 충족될 때까지 Claude를 계속 작동시키기
- Claude Code Agent View - 여러 에이전트 세션을 한 화면에서 관리하기
- Anthropic가 공개한 Claude for Financial Services: 금융 워크플로우 에이전트·스킬·커넥터 오픈소스
- Direct Corpus Interaction: 임베딩 없이 grep과 셸로 BRIGHT, BEIR 벤치마크 SOTA 달성
- AI Co-Mathematician: 수학자와 협업하는 에이전트 워크벤치, FrontierMath Tier 4에서 48% 달성
- agentmemory: AI 코딩 에이전트를 위한 영구 메모리 MCP 서버
- Matt Pocock의 Skills, 실전 엔지니어를 위한 작고 조립 가능한 에이전트 스킬
- Cloudflare 1,100명 감원, AI 네이티브 운영을 위한 조직 재설계
- Multiagent Debate - 다중 에이전트 토론으로 LLM 사실성과 추론 향상
- Better Harness: Evals를 학습 신호로 삼는 하네스 힐 클라이밍
- Codex CLI 0.128.0의 /goal 명령과 Ralph Loop 기반 자율 에이전트
- Agent Middleware: 6개의 훅으로 에이전트 하네스 커스터마이징하기
- 하네스 엔지니어링으로 Deep Agents 점수 13.7점 끌어올리기
- Deep Agents의 Evals 설계: 양보다 질, 행동 기반 평가 만들기
- 에이전트 하네스의 해부학: 모델을 둘러싼 시스템의 모든 것
- Ouroboros - 한국 개발자가 만든 Specification-First AI 코딩 Agent OS
- Agent Harness Engineering: 모델보다 그 주변이 더 결정적이라는 Addy Osmani의 정리
- Gemini 앱이 Docs Sheets Slides DOCX XLSX PDF를 직접 생성하기 시작했다
- Claude Code와 Codex를 함께 쓰는 이유: 게이트가 아닌 어드바이저로 묶는 듀얼 에이전트 워크플로
- Gemini Enterprise Agent Platform - Vertex AI를 잇는 4 필러 에이전트 플랫폼
- A2A와 MCP가 함께 동작하는 방식 - 멀티 에이전트 시스템을 위한 5가지 통합 패턴
- Google Gemini Deep Research Agent - 장기 리서치 과제를 자동 수행하는 Interactions API
- Google Cloud Agent Governance Stack - 에이전트 함대를 엔지니어링 조직처럼 다루는 5계층
- Google agents-cli - 코딩 어시스턴트를 Google Cloud 에이전트 전문가로 만드는 스킬 레이어
- Roo Code v3.36 업데이트: 비파괴 컨텍스트 관리, GPT-5.2, Gemini 3 Flash, Claude Sonnet 1M 지원
- Kimi K2.6 공개: 1T MoE 오픈소스 모델의 에이전틱 코딩 도약
- Gemini in Chrome 한국 출시: AI가 탑재된 브라우저가 바꿀 일상
- Anthropic의 Harness Design: 장시간 실행 에이전트를 위한 Generator-Evaluator 구조
- Anthropic Claude Design 공개 - Opus 4.7 비전 모델 기반 협업 디자인 도구
- Qwen3.6-35B-A3B: 350억 파라미터 MoE 모델, 30억만 활성화하는 에이전틱 코딩 오픈소스
- Claude Opus 4.7 출시: 셀프 검증, 3.3배 고해상도 비전, 코딩 13% 향상
- OpenAI Agents SDK 진화 - 네이티브 샌드박스와 모델 네이티브 하네스
- Gemini CLI Subagents 도입 - 독립 컨텍스트 기반 병렬 오케스트레이션
- Gemini Robotics-ER 1.6: 로봇을 위한 추론 우선 모델
- Claude Code 100시간 vs Codex 20시간 14년차 엔지니어의 비교 후기
- k-skill 한국인을 위한 AI 에이전트 스킬 모음집
- MiniMax-M2.7 자기 진화하는 오픈 웨이트 모델과 공식 CLI
- Nous Research Hermes Agent 자기 진화하는 AI 에이전트 프레임워크
- AGENTS.md, AI 코딩 에이전트를 위한 표준 지침 파일
- Claude Advisor 전략: Opus와 Sonnet의 지능형 협업 모델
- Agent Skills: AI 코딩 에이전트를 위한 프로덕션급 엔지니어링 스킬
- AI 에이전틱 패턴 4년의 진화: 프롬프트에서 하네스까지
- Meta HyperAgents: 자기 개선형 AI 에이전트 프레임워크
- Anthropic Managed Agents: 두뇌와 손을 분리하는 에이전트 아키텍처
- 감정적 프롬프트가 AI 성능을 바꿀까? EmotionRL 적응형 감정 프레이밍 연구
- Cursor 3.0: 에이전트 중심으로 완전히 재설계된 개발 환경
- 멀티 에이전트 오케스트레이션의 현실: $5,000 실험에서 배운 교훈
- 코딩 에이전트의 6가지 핵심 구성 요소: 모델보다 하니스가 중요하다
- Claude Code 성능 저하 논란: Adaptive Thinking 도입 후 68% 불만 증가
- Claude Code 사칭 악성코드 급증: InstallFix 캠페인부터 npm 타이포스쿼팅까지
- GitHub Copilot SDK 퍼블릭 프리뷰: 에이전트 런타임을 직접 통합하는 방법
- Claude 구독 플랜, 써드파티 도구 사용 제한 발표: 배경과 대응 방안
- Hermes Agent: Nous Research의 자기 학습형 자율 AI 에이전트 플랫폼
- Claude Code 소스 유출 전체 분석: 사건 경위부터 내부 구조, 숨겨진 기능, 업계 교훈까지
- Claude Code의 숨겨진 강력한 기능 15가지
- OpenAI, Claude Code용 Codex 플러그인 공개 - 코드 리뷰와 작업 위임
- Harness - Claude Code용 에이전트 팀 & 스킬 아키텍트 플러그인
- 에이전틱 SaaS가 바꾸는 미래 - UI, 아키텍처, 과금 모델의 변화
- A2A Protocol v1.0 마이그레이션 가이드 - 주요 변경사항과 전환 전략
- OpenAI Codex 공식 활용 사례 12가지 총정리
- Claude 컴퓨터 제어 기능 출시 - 마우스, 키보드, 화면 직접 조작
- Anthropic 하네스 설계 - 장기 실행 앱 개발을 위한 멀티 에이전트 아키텍처
- Claude Code 치트시트 - 단축키, 명령어, 설정 완벽 가이드
- Claude Code로 생산성 극대화하기 - 인프라 중심 워크플로우 혁신
- 2026 Bio-AI 오픈소스 감사 보고서 - 10개 저장소의 신뢰성 검증 결과
- AI 코딩 에이전트, 속도를 늦춰야 하는 이유 - 품질 저하 경고와 올바른 활용법
- 충분히 상세한 명세는 곧 코드다 - AI 에이전트 코딩의 한계
- Andrej Karpathy가 말하는 코드 에이전트, AutoResearch, 그리고 AI의 루피 시대
- 하네스 엔지니어링 - AI 에이전트 성능을 좌우하는 시스템 설계의 모든 것
- AI 에이전트 실전 활용의 최전선 - 하네스 설계부터 자율 연구, 자기 진화 모델까지
- cmux - Ghostty 기반 AI 코딩 에이전트 전용 macOS 터미널
- AI 시대 개발 방법론 - SDD와 TDD의 결합으로 에이전트 코딩 품질 보장하기
- AI 에이전트 프로토콜 개발자 가이드 - MCP, A2A 등 6가지 프로토콜 총정리
- OpenAI Codex - 소프트웨어 엔지니어를 위한 AI 에이전트 플랫폼
- Claude Code Skills 활용 교훈 - Anthropic이 공유하는 9가지 스킬 카테고리와 작성 팁
- OpenJarvis - 스탠포드가 만든 로컬 디바이스 개인용 AI 스택
- AI 도구 도입만으로는 부족하다 - AX 조직 전환의 5가지 축
- NVIDIA NemoClaw - AI 에이전트를 위한 샌드박스 보안 스택
- AutoBE - 자연어로 백엔드를 자동 생성하는 AI 빌더
- LLM으로 소프트웨어를 만드는 방법 - 아키텍트-개발자-리뷰어 다중 에이전트 워크플로우
- 코드 리뷰는 죽었다 - AI 시대의 스펙 기반 검증으로의 전환
- MCP는 죽었다, MCP 만세 - 엔터프라이즈 환경에서 MCP가 여전히 필수인 이유
- Replit Agent 4 출시 : 디자인 캔버스, 병렬 태스크, 태스크 보드까지 역대급 업데이트
- AgentHub: AI 에이전트를 위한 경량 협업 플랫폼과 Autoresearch GPT-2 튜닝 성과
- NanoClaw - Docker 컨테이너 격리를 통한 안전한 AI 에이전트 실행 오픈소스 아키텍처
- OpenAI AI 에이전트 구축 실용 가이드 - 설계부터 배포까지
- OpenAI 하네스 엔지니어링 - 에이전트 우선 개발로 5개월간 코드 없이 제품 구축
- Anthropic Skill Creator 업데이트 - Eval 테스트와 멀티 에이전트 검증
- AI 에이전트 워크플로우 패턴 3가지 - 순차, 병렬, 평가자-최적화
- LangChain 스킬 공개 - Claude Code 통과율을 25%에서 95%로 끌어올린 방법
- OpenAI Symphony - AI 에이전트 기반 프로젝트 관리 자동화
- Karpathy의 AutoResearch - AI 에이전트가 밤새 자율적으로 LLM 연구를 수행하는 프레임워크
- Claude Code Review - 멀티 에이전트 PR 코드 리뷰 기능 출시
- AI 에이전트를 위한 CLI 재설계 - 5가지 핵심 원칙
- Simon Willison의 에이전틱 엔지니어링 패턴 가이드
- Anthropic Academy - 무료 AI 교육 플랫폼 출시
- OpenAI Codex Windows 앱 - 네이티브 샌드박스와 병렬 에이전트
- AI 에이전트 메모리 실험: 요약된 지식이 오히려 성능을 떨어뜨린다
- 에이전틱 엔지니어링 시대의 생존 스킬 9가지
- Perplexity Computer - 19개 AI 모델을 조율하는 범용 디지털 워커
- MCP는 죽었다, CLI 만세 - LLM 도구 통합의 현실적 대안
- Anthropic AI 에이전트 자율성 측정 연구 - 에이전트 절반이 코딩, 사용자 신뢰는 점진적 증가
- Claude Cowork 반복 작업 스케줄링 기능 출시
- Claude Code 메모리 관리 - Auto Memory와 CLAUDE.md 완벽 가이드
- Andrej Karpathy: AI 에이전트가 코딩의 패러다임을 바꾸다
- AI가 내 스타트업을 죽였다 - 포스트 Claude 시대의 마케팅 미래
- AGENTS.md를 올바르게 사용하는 방법 - /init 자동 생성이 오히려 비용을 높이는 이유
- Claude Code에 Gemini 연결하기 - 프록시 백엔드로 저렴하게 사용
- 2026년 2월 코딩 에이전트 현황 - Claude와 Codex 병행 활용
- Claude Code 활용법 - 계획과 실행 분리 워크플로우
- Claude Cowork Legal Plugin - 법률 업무 자동화와 시장 충격
- Pi - OpenClaw의 핵심이자 극도로 단순화된 코딩 에이전트 분석
- Clawdbot의 메모리 관리 - Markdown 기반 하이브리드 메모리 아키텍처
- Plannotator - 코딩 에이전트의 계획을 시각적으로 검토하고 주석을 다는 도구
- Claude Skills 구축 완전 가이드 - 재사용 가능한 워크플로 자산 만들기
- CB Insights 2026 기술 트렌드 보고서 - AI 에이전트부터 소버린 AI, 피지컬 AI까지
- 2026년 AI 코딩 주요 트렌드 - 자율 에이전트 루프부터 멀티 에이전트 오케스트레이션까지
- OpenAI 내부 데이터 에이전트 - 질문에서 인사이트까지 수 분 만에
- DeepPlanning - 장기 계획 수립 에이전트를 위한 벤치마크
- Kimi K2.5 - Moonshot AI의 1조 파라미터 오픈 웨이트 멀티모달 모델
- 2026년 데이터 엔지니어링을 재편하는 5가지 AI 트렌드
- OpenAI Codex Agent Loop - 에이전트 루프의 내부 동작 원리
- Planning with Files - Manus 방식으로 AI 에이전트 컨텍스트 문제 해결하기
- Claude Cowork - 개발자를 넘어 모든 업무로 확장되는 AI 에이전트
- LlamaIndex vs LangGraph - RAG와 멀티 에이전트 워크플로우의 선택
- DeepAgents + Open Deep Research - AI 기반 자동화 리서치 시스템 구축하기
- DeepAgents - LangChain 기반 장기 작업 AI 에이전트 프레임워크
- LangSmith tracer 에러 및 해결 방법
- A2A란 무엇인가?