METR의 AI 시간 지평 연구 - AI 자율성이 6개월마다 두 배씩 성장한다
목차 개요 시간 지평이란? 방법론 주요 발견 한계와 주의사항 결론 Reference 개요 METR(Machine Evaluation and Testing Research, 캘리포니아 버클리 소재 비영리 AI 연구기관)이 프론티어 AI 모델의 자율적 작업 수행 능력을 정량화한 연구를 발표했습니다. 이 연구의 핵심 지표...
목차 개요 시간 지평이란? 방법론 주요 발견 한계와 주의사항 결론 Reference 개요 METR(Machine Evaluation and Testing Research, 캘리포니아 버클리 소재 비영리 AI 연구기관)이 프론티어 AI 모델의 자율적 작업 수행 능력을 정량화한 연구를 발표했습니다. 이 연구의 핵심 지표...
목차 개요 해커톤 수상자 분석 공통점: 현장 전문가의 문제 인식 시사점 결론 Reference 개요 Anthropic이 주최한 Claude Code 해커톤에 500명의 빌더가 참가해 일주일 동안 Claude와 Claude Code를 활용한 프로젝트를 제작했습니다. 해커톤이 마무리되고 수상자 명단이 공개됐는데, 여기서 흥...
목차 개요 생산성 역설 어려운 부분만 남기는 구조 맥락 손실의 문제 바이브 코딩의 함정 올바른 활용법 결론 Reference 개요 AI 코딩 도구가 개발자를 10배 더 생산적으로 만든다는 주장이 있다. 하지만 많은 개발자들이 오히려 더 많은 시간을 소비하고 번아웃을 경험하고 있다. AI는 쉬운 일을 더 쉽게 만들...
목차 개요 하네스 문제란 Hashline 솔루션 주요 성과 업계의 반응 결론 Reference 개요 AI 코딩 성능은 모델을 바꿔야만 향상될까? Can Boluk는 모델은 그대로 두고 하네스(Harness)만 바꿔서 16개 LLM의 코딩 성능을 획기적으로 개선했다. 일부 모델은 성공률이 6.7%에서 68.3%까지 올...
목차 개요 Claude Desktop Extensions 취약점 ClawHub 악성 스킬 사례 구조적 취약성의 본질 보안과 유용성의 갈등 결론 Reference 개요 AI 에이전트가 강력해질수록 보안 위협도 커진다. 최근 Claude Desktop Extensions(DXT)에서 CVSS 10점 만점의 원격 코드 실...
목차 개요 기존 방식의 문제점 파일 네이티브 접근법 구현 방식 실제 성과 결론 Reference 개요 AI 에이전트가 파일을 처리할 때 왜 자주 실패할까? HxAI Australia의 Damon McMillan은 파일 처리 방식 자체를 바꿔 성공률을 33%에서 95%로 끌어올렸다. 핵심은 파일 내용을 텍스트로 변환해...
목차 개요 10배 생산성은 실제다 가치 포획의 딜레마 AI 뱀파이어 현상 비현실적인 기준을 만드는 사람들 스타트업이 우물에 독을 풀고 있다 달러 나누기 시간 - 해법의 공식 새로운 근무일의 기준 결론 Reference 개요 Steve Yegge가 AI 도구 사용으로 인한 개발자 번아웃 현상을 “AI 뱀파이...
목차 개요 GEO 스팸이란 GEO 스팸의 4가지 유형 왜 위험한가 플랫폼의 대응 방안 결론 Reference 개요 AI 검색 엔진이 빠르게 보급되면서 새로운 형태의 스팸이 등장했다. GEO(Generative Engine Optimization) 스팸은 AI 검색 엔진의 그라운딩 시스템을 악용해 AI 답변을 조작하는...