LLM 275
- Free-Router: 무료 AI 모델을 실시간 모니터링하고 전환하는 CLI 도구
- token-router : 클라우드 LLM 전송 전 로컬에서 필요한 라인만 추출하기
- Anthropic Mythos 접근 회수 논란 : SK텔레콤·수출 통제·공급망 신뢰
- Kimi K2.7 Code : 장기 코딩에 특화된 오픈 가중치 에이전트 모델
- GLM-5.2 : 1M 컨텍스트를 지원하는 완전 오픈 프런티어 모델
- DiffusionGemma : 확산 기반으로 더 빠른 텍스트 생성
- OpenPipe ART: 경험으로 학습하는 에이전트 강화학습 트레이너
- Headroom: AI 에이전트를 위한 컨텍스트 압축 레이어
- Gemini-SQL2: BIRD 벤치마크 80.04점을 기록한 텍스트-투-SQL의 도약
- From AGI to ASI: 초지능으로 가는 네 갈래 경로와 병목 분석
- HRM-Text-1B: 계층적 추론 모델 기반 1B 언어 모델
- Claude Fable 5 & Mythos 5 접근 중단 - 미국 정부 수출 통제 지시
- 자가진화 LLM 에이전트의 능력 붕괴: 경험 내재화를 다시 생각하다
- SIA: 하네스와 가중치를 동시에 업데이트하는 자기 개선 AI 시스템
- AI+HW 2035: AI와 하드웨어 공동 설계의 10년 로드맵
- Self-Harness: LLM 에이전트가 스스로 실행 환경을 개선하는 프레임워크
- Hermes Agent Self-Evolution: DSPy+GEPA로 에이전트 스킬·프롬프트를 자동 진화시키는 파이프라인
- Gated DeltaNet-2: 선형 어텐션에서 삭제와 쓰기 게이트 분리
- Boson AI Higgs Audio v3 TTS 4B 모델
- Agentopia: 에이전트 사회에서의 장기 생활 시뮬레이션과 학습
- DiffusionGemma - 병렬 텍스트 생성과 Diffusion 기반 언어 모델
- LLM 시각 가이드 Part 1 - 토크나이제이션과 임베딩
- LLM 평가의 맹점: Test-Time Compute를 측정에 포함해야 하는 이유
- Claude Fable 5 & Mythos 5 - Anthropic 새 모델 발표
- Microsoft Scout - 상시 작동하는 개인 AI 에이전트
- Microsoft MAI-Code-1-Flash: 일상 개발자 워크플로우를 위한 코딩 모델
- claude-oceanus 유출 루머: 엔터프라이즈 전용 고가 모델이라는 주장
- World Models Meet Language Models: 언제 시뮬레이션을 믿어야 하는가
- Open Athena: LLM 사전학습을 3.6배 빠르게 만든 스택
- NVIDIA Nemotron-3-Ultra: 550B LatentMoE 추론 모델
- Cosmos 3: Physical AI를 위한 옴니모달 월드 모델
- Ideogram 4: 첫 오픈 웨이트 텍스트-이미지 파운데이션 모델
- Microsoft MAI: 언덕 오르기 기계로 만든 7개의 새 모델
- VLM3: 비전 언어 모델은 태생부터 3D 학습기다
- OpenAI 프런티어 모델과 Codex, 이제 AWS에서 쓴다
- Gemma 4 12B: 인코더 없는 통합 멀티모달 모델
- 에이전트 워크플로를 LLM 가중치로 컴파일하기: 100배 저렴한 지하 에이전트
- LLM 에이전트가 직접 학습 데이터를 만든다: 자율 에이전트 데이터 엔지니어링
- DNA3.0-35B-A3B: Dnotitia의 한국어 특화 MoE 비전-언어 모델
- Claude Opus 4.8: 정직성, 동적 워크플로우, 노력 제어
- Native Multimodal Modeling 로드맵: 융합 아키텍처에서 평가까지의 5단계 분류
- 하이퍼커넥트 LLM 설명 정책 - 정답 없는 문제를 반복적 합의로 푸는 5단계 접근법
- JEPA - 얀 르쿤이 제시한 자기회귀 생성 모델의 대안 아키텍처
- AutoResearch - 과학 연구 자동화의 5단계 자율성 스펙트럼(L0-L4) 서베이
- AI 혁명은 산업혁명과 다르다 - 토큰 기반 가격이 만드는 생산성 역설
- 2026년 알아야 할 5가지 RAG 아키텍처 - Hybrid, Graph, Agentic, Corrective, Multimodal
- NuExtract3 - 4B 비전-언어 모델로 문서에서 JSON 추출과 마크다운 변환을 동시에
- Free Claude Code - Claude Code를 17개 AI 제공자로 라우팅하는 오픈소스 프록시
- TurboQuant 완전 정리 - 이론 최적에 근접한 KV 캐시·벡터 검색 양자화와 vLLM 실측
- Google, I/O 2026에서 Gemini 3.5 정식 공개 - 에이전트 성능과 새 구독 체계
- Qwen 3.5의 검열 회로 해부 - 가중치에 새겨진 국가 검열의 메커니즘 해석
- ELF: 임베딩 공간 Flow Matching 으로 디스크리트 확산 모델을 추월한 연속 언어 확산
- Model Merging Scaling Laws — 10,506개 병합 실험으로 도출한 LLM 병합 스케일링 법칙
- TTL Tech Note — 지식 증류와 LLM 사이즈 선택, 14B/32B/70B의 실전 기준
- AI IQ : 17개 벤치마크로 AI 모델의 지능과 EQ, 비용을 동시에 측정하는 플랫폼
- Humanloop가 정리한 2025 RAG 아키텍처 8가지 — Simple부터 Agentic까지
- Google, I/O 2026에서 새 Gemini 공개 예정 — GPT-5.5급, Mythos에는 못 미친다는 보도
- Meta Muse Spark 공개 — Superintelligence Labs의 첫 멀티모달 추론 모델
- Anthropic — Claude에게 '왜'를 가르치기, 에이전틱 정렬 학습 연구
- OpenAI Codex Mobile - ChatGPT 앱에서 데스크톱 코딩 에이전트를 원격 관리
- Microsoft MDASH - 100개 이상의 AI 에이전트로 사이버짐 1위, 앤트로픽 미토스를 능가하다
- DeepSeek-TUI - 터미널에서 실행되는 DeepSeek V4 코딩 에이전트
- Qwen3.7-Max 공개: 에이전트 시대를 겨냥한 알리바바의 프런티어 모델
- Prompt Engineering Guide - 74.6k 스타의 오픈소스 프롬프트 학습 자료
- Cohere Command A+ 공개: W4A4 양자화로 단일 GPU에서 돌아가는 218B MoE 모델
- Code as Agent Harness: 코드를 에이전트 실행 기반으로 보는 새로운 관점 (서베이)
- Claude 유료 플랜의 프로그래매틱 크레딧 분리 - Agent SDK와 claude -p가 별도 한도로
- Qwen-Image-2.0 텍스트 렌더링과 이미지 편집을 하나로 묶은 통합 생성 모델
- Code with Claude SF 컨퍼런스 정리 - 19개 세션이 보여준 Anthropic의 차세대 개발 청사진
- LoPE 무의미한 Lorem Ipsum이 LLM 수학 추론을 끌어올리는 메커니즘
- Claude 90% 할인 중국 암시장의 정체와 AI 데이터 탈취 위험
- Bifrost: LiteLLM보다 50배 빠르다는 Go 기반 초고속 AI 게이트웨이
- TokenSpeed: 에이전트 워크로드를 위한 빛의 속도 LLM 추론 엔진
- Direct Corpus Interaction: 임베딩 없이 grep과 셸로 BRIGHT, BEIR 벤치마크 SOTA 달성
- Anthropic Teaching Claude Why: 원칙 기반 정렬로 블랙메일률 65%에서 19%로
- 중국, 미국 제치고 AI 인재 경쟁 1위로: NeurIPS 최상위 연구자 통계가 보여주는 지각 변동
- AI Co-Mathematician: 수학자와 협업하는 에이전트 워크벤치, FrontierMath Tier 4에서 48% 달성
- OpenAI GPT-Realtime-2, Translate, Whisper - GPT-5급 추론을 갖춘 실시간 음성 API 모델 3종 공개
- DGX Spark에서 Qwen3.5-122B-A10B 추론 80% 가속: INT4+FP8 하이브리드와 MTP-2 투기적 디코딩
- Multiagent Debate - 다중 에이전트 토론으로 LLM 사실성과 추론 향상
- Gemma 4 Multi-Token Prediction - 품질 손실 없이 최대 3배 추론 가속
- GOAT - 학습 가능한 사전 분포로 어텐션 메커니즘을 재설계하다
- ECE7115, 인하대 Multimodal VLM 강의가 Stanford CS336을 따라가는 법
- Vision Banana, 이미지 생성 모델이 범용 비전 학습자가 된다
- 바이브 코딩의 환상 - AI가 만드는 실행되는 코드와 사람이 원하는 제품의 간극
- DeepSeek-V4 패밀리 공개, Flash와 Pro 그리고 1.6T 베이스 모델
- GLM-5 Scaling Pain: PD 분리 KV 캐시 race, HiCache 동기화 누락, LayerSplit가 풀어낸 코딩 에이전트 서빙의 진짜 병목
- Anthropic-AWS 10년 1000억 달러 컴퓨트 파트너십: Trainium 기반 5GW 확보
- vLLM Recipes 개편: 모델과 하드웨어 조합을 한 줄 명령어로
- Google Gemini Deep Research Agent - 장기 리서치 과제를 자동 수행하는 Interactions API
- OpenAI GPT-5.5 공개 - 에이전틱 코딩, 지식 노동, 과학 연구의 새 기준
- Anthropic Claude Code 품질 저하 사후분석 - 한 달 동안 겹친 세 가지 버그
- 스페이스X, 커서 600억 달러 인수 옵션 확보: xAI 합병 후 AI 코딩 시장 본격 진입
- Martin Fowler의 2026년 4월 단상 - 인지 부채, AI 시스템 3, 검증의 재발견
- DeepSeek-V4-Pro 공개 - 1.6T MoE, 49B 활성 파라미터, 1M 컨텍스트, FP4/FP8 혼합 정밀도
- Google DeepMind 엘리트 코딩 팀 구성: Anthropic과의 격차를 좁히는 2026년 전략
- Anthropic Pro 플랜에서 Claude Code 제거 논란: 2% 테스트인가, 정책 전환의 신호탄인가
- OpenClaw Anthropic Provider 복귀: Claude CLI 재사용과 API 키 설정 완벽 가이드
- OpenAI ChatGPT Images 2.0: 2K 정밀도와 비라틴 문자 렌더링 혁신
- Google LiteRT-LM: 엣지 디바이스용 고성능 온디바이스 LLM 추론 프레임워크
- Roo Code v3.36 업데이트: 비파괴 컨텍스트 관리, GPT-5.2, Gemini 3 Flash, Claude Sonnet 1M 지원
- Needle In A Haystack: 장문 컨텍스트 LLM의 검색 능력을 재는 벤치마크
- Claude Opus 4.7 개발자 리뷰: 마이그레이션 체크리스트와 Breaking Changes
- Claude Live Artifacts: Cowork에서 자동 갱신 대시보드 만들기
- Kimi K2.6 공개: 1T MoE 오픈소스 모델의 에이전틱 코딩 도약
- Claude와 Codex 토큰 효율 높이기: 설정 조정으로 누수를 막는 법
- 챗GPT에 아이디어를 바로 묻지 말라: 독일 연구팀이 밝힌 '설계 고착화' 현상과 HAICo 해법
- Anthropic의 Harness Design: 장시간 실행 에이전트를 위한 Generator-Evaluator 구조
- Friends Don't Let Friends Use Ollama - llama.cpp 기반 대안 재검토
- OpenAI Trusted Access for Cyber 확대와 GPT-5.4-Cyber 공개
- Anthropic Claude Design 공개 - Opus 4.7 비전 모델 기반 협업 디자인 도구
- Qwen3.6-35B-A3B: 350억 파라미터 MoE 모델, 30억만 활성화하는 에이전틱 코딩 오픈소스
- Claude Opus 4.7 출시: 셀프 검증, 3.3배 고해상도 비전, 코딩 13% 향상
- SuperGemma4 26B Uncensored MLX 4bit v2 - Apple Silicon용 고속 로컬 에이전트 모델
- MiniMax-M2.7 자기 진화하는 오픈 웨이트 모델과 공식 CLI
- Gemma 4 로컬 모델로 Codex CLI 돌려보기 실전 테스트
- Microsoft VibeVoice: 장형식 음성 처리를 위한 오픈소스 ASR/TTS 패밀리
- Microsoft Foundry Local: 제로 셋업으로 동작하는 통합 로컬 AI 엔진
- NVIDIA·MIT TriAttention, KV 캐시 메모리를 10배 줄이다
- LG EXAONE 4.5 33B: 한국어 특화 첫 오픈 비전-언어 모델
- Meta의 새 AI 모델 전략: 부분 오픈소스와 독점의 혼합
- Claude Advisor 전략: Opus와 Sonnet의 지능형 협업 모델
- Anthropic Managed Agents: 두뇌와 손을 분리하는 에이전트 아키텍처
- 감정적 프롬프트가 AI 성능을 바꿀까? EmotionRL 적응형 감정 프레이밍 연구
- Google AI Edge Gallery: 모바일에서 Gemma 4를 완전 오프라인으로 실행하는 앱
- RTK: AI 코딩 도구의 토큰 소비를 60~90% 줄이는 Rust CLI 프록시
- LM Studio CLI로 Google Gemma 4 로컬 실행: M4 Pro에서 51 tok/s 달성
- 코딩 에이전트의 6가지 핵심 구성 요소: 모델보다 하니스가 중요하다
- Claude Code 성능 저하 논란: Adaptive Thinking 도입 후 68% 불만 증가
- Google Gemma 4: Gemini 3 기반 오픈 AI 모델, 멀티모달·에이전트·엣지 지원
- Hermes Agent: Nous Research의 자기 학습형 자율 AI 에이전트 플랫폼
- Ollama, Apple Silicon에서 MLX 기반 구동 프리뷰 - 최대 2배 성능 향상
- Anthropic Claude Mythos, 데이터 유출로 존재가 드러난 차세대 AI 모델
- Anthropic 하네스 설계 - 장기 실행 앱 개발을 위한 멀티 에이전트 아키텍처
- LiteLLM PyPI 공급망 공격 - 악성 코드 삽입 보안 사건 분석
- Google TurboQuant - 극한 압축으로 AI 효율성을 재정의하는 양자화 알고리듬
- Andrej Karpathy가 말하는 코드 에이전트, AutoResearch, 그리고 AI의 루피 시대
- System 3: AI는 도구가 아닌 제3의 사고 시스템
- 하네스 엔지니어링 - AI 에이전트 성능을 좌우하는 시스템 설계의 모든 것
- AI 에이전트 실전 활용의 최전선 - 하네스 설계부터 자율 연구, 자기 진화 모델까지
- Cursor Composer 2 - 자체 코딩 AI 모델로 최첨단 성능과 저렴한 비용의 새로운 조합
- LLM을 컴퓨터로 만들기 - 트랜스포머 내부에서 프로그램을 실행하는 방법
- Trie 기반 빔 서치 - LLM 디코딩의 메모리와 속도를 동시에 잡다
- OpenJarvis - 스탠포드가 만든 로컬 디바이스 개인용 AI 스택
- llmfit - 내 하드웨어에 맞는 LLM 모델을 찾아주는 터미널 도구
- LLM Architecture Gallery - 43개 LLM 아키텍처를 한눈에 비교하는 갤러리
- LLM으로 소프트웨어를 만드는 방법 - 아키텍트-개발자-리뷰어 다중 에이전트 워크플로우
- Attention Residuals: 기존 잔차 연결을 대체하는 새로운 Transformer 아키텍처
- LLM 신경해부학: 가중치 변경 없이 중간 레이어 복제로 리더보드 1위 달성
- AgentHub: AI 에이전트를 위한 경량 협업 플랫폼과 Autoresearch GPT-2 튜닝 성과
- Claude Opus 4.6 & Sonnet 4.6 - 1M 컨텍스트 윈도우 정식 출시
- CanIRun.ai - 내 컴퓨터에서 실행 가능한 AI 모델을 확인하는 도구
- Claude 인터랙티브 시각화 - 대화 속 실시간 차트와 다이어그램
- 프롬프트의 정중함이 LLM 정확도에 미치는 영향 - Mind Your Tone 논문 분석
- Deep Think with Confidence - LLM 추론의 신뢰도 평가 연구
- Google Gemini Embedding 2 - 최초의 네이티브 멀티모달 임베딩 모델
- GPT-5.4의 1M 컨텍스트 윈도우, 기본 설정으로는 258K만 사용 가능
- Karpathy의 AutoResearch - AI 에이전트가 밤새 자율적으로 LLM 연구를 수행하는 프레임워크
- OpenAI GPT-5.4 공개 - 1M 컨텍스트와 네이티브 컴퓨터 사용
- LLM의 L은 거짓말을 의미한다 - AI 코드 생성의 위조 논란
- AI 코드 재작성을 통한 라이선스 세탁 논란 - chardet 사례
- Redis 코딩 패턴 - antirez의 새로운 공식 문서 사이트
- Anthropic Academy - 무료 AI 교육 플랫폼 출시
- Qwen3.5 - 알리바바의 새로운 대규모 언어 모델 시리즈
- AI 에이전트 메모리 실험: 요약된 지식이 오히려 성능을 떨어뜨린다
- Anthropic 페르소나 선택 모델(PSM) - Claude는 캐릭터다, AI의 인간적 행동 원리
- Sam Altman - AI가 AI 연구를 가속한다, 예상보다 빠른 초지능 도래와 준비되지 않은 세계
- Perplexity Computer - 19개 AI 모델을 조율하는 범용 디지털 워커
- Claude Cowork 반복 작업 스케줄링 기능 출시
- Claude Code에서 발견된 3가지 보안 취약점: RCE와 API 키 탈취
- Anthropic, 핵심 AI 안전 서약 RSP 철회
- AI가 만든 테스트는 전부 통과했지만, 코드에는 버그가 남아있었다
- Google AI 검색이 Grounding Snippet을 추출하는 방법 분석
- Claude Code Remote Control - 로컬 세션을 어디서든 이어받기
- Andrej Karpathy: AI 에이전트가 코딩의 패러다임을 바꾸다
- 프롬프트 반복으로 LLM 성능 향상 - Google 연구팀 논문
- AI가 내 스타트업을 죽였다 - 포스트 Claude 시대의 마케팅 미래
- AGENTS.md를 올바르게 사용하는 방법 - /init 자동 생성이 오히려 비용을 높이는 이유
- Claude Code에 Gemini 연결하기 - 프록시 백엔드로 저렴하게 사용
- Anthropic의 AI 모델 증류 공격 탐지 및 방지 사례
- Taalas - LLM 가중치를 실리콘에 새기다, 초당 17,000 토큰 ASIC 칩
- 2026년 2월 코딩 에이전트 현황 - Claude와 Codex 병행 활용
- 코드를 읽지 않는 시대, 엔지니어는 무엇을 읽어야 하는가
- Claude Code 구축에서 얻은 교훈 - 프롬프트 캐싱이 전부다
- FINAL Bench - AI 메타인지를 측정하는 첫 번째 벤치마크
- METR의 AI 시간 지평 연구 - AI 자율성이 6개월마다 두 배씩 성장한다
- AI 코딩 성능 10배 개선한 방법 - 모델이 아닌 편집 도구를 바꿨다
- AI 에이전트 파일 처리 성공률 33%→95% - 파일 네이티브 접근법의 발견
- AI 검색에 스팸이 침투하고 있다 - GEO 스팸의 구조와 플랫폼의 대응
- 같은 AI 모델이 다르게 작동하는 이유 - 시스템 프롬프트의 숨은 영향력
- AI는 왜 5분 전 말을 까먹을까 - GitHub Copilot의 에이전틱 메모리 시스템
- 멀티 에이전트 오케스트레이션 실전: Microsoft Agent Framework로 만드는 AI 팟캐스트 스튜디오
- Gemini CLI 훅 기능, AI 에이전트에 보안 정책 자동 주입
- ChatGPT가 진짜 개발 환경이 됐다, Bash·npm·pip 설치까지 지원
- AI 에이전트가 자면서 코딩한다, Ralph Wiggum 기법 실전 가이드
- Claude 에이전트 팀, 2주 만에 리눅스 컴파일러 제작한 방법
- AI 에이전트 샌드박스 통합, 두 가지 아키텍처 패턴과 선택 기준
- Steve Yegge가 말하는 AI 에이전트 시대와 소프트웨어 엔지니어링의 미래
- WordPress.com Claude 커넥터 - MCP 기반 AI 사이트 분석 통합
- Andrej Karpathy의 CLAUDE.md - AI 코딩 실수를 줄이는 65줄 가이드라인
- Cursor Composer 1.5 - 강화학습 20배 스케일링으로 코딩 성능 향상
- Claude Cowork Windows 완전 지원 - macOS와 동일한 기능 제공
- 안전한 자연어 기반 API 구축 방법 - 프로덕션 환경을 위한 아키텍처 가이드
- Claude Code Agent Teams(Swarms) - 멀티 에이전트 협업 아키텍처 가이드
- Hot Mess of AI - AI가 실패할 때 체계적 오류보다 비일관성이 더 위험하다
- Claude Opus 4.6 Fast Mode - 2.5배 빠른 응답, 새로운 고속 모드
- SmythOS SRE - AI 에이전트를 위한 오픈소스 런타임 환경
- Craft Agents - AI 에이전트를 위한 오픈소스 인터페이스
- Claude Opus 4 활용 가이드 - 최대 효과를 이끌어내는 5가지 핵심 전략
- 두 종류의 AI 사용자: 놀라운 격차가 벌어지고 있다
- AI 의사결정지원 시스템이 실패하는 진짜 이유 - 신뢰 보정의 부재
- AI 코드와 소프트웨어 장인정신
- AI 에이전트 코딩 80% 시대의 진짜 문제 - 이해 부채
- Claude Code /insights 명령어 - 사용 패턴 분석과 워크플로 개선 제안
- 국제 AI 안전 보고서 2026 - 범용 AI의 역량과 위험
- 두 번째 사전학습 패러다임, 세계 모델링의 시대
- AI 코딩 도구, 속도는 늘지 않고 학습은 약해진다? 앤트로픽 실험 정리
- AI는 이미 인간 수준인가? 튜링 기준으로 본 AGI 논쟁
- Qwen3-Coder-Next - 80B 파라미터 중 3B만 활성화하는 초희소 코딩 에이전트 모델
- MemoryLLM - 트랜스포머 FFN을 해석 가능한 플러그앤플레이 메모리로 분리
- 임베딩 확장이 전문가 확장보다 우수하다 - LLM 아키텍처의 새로운 방향
- SCONE - 언어 모델의 임베딩 레이어 확장 기법
- AI 코딩 보조 도구가 개발자 기술 형성에 미치는 영향 - Anthropic 연구
- Pi - OpenClaw의 핵심이자 극도로 단순화된 코딩 에이전트 분석
- Clawdbot의 메모리 관리 - Markdown 기반 하이브리드 메모리 아키텍처
- CB Insights 2026 기술 트렌드 보고서 - AI 에이전트부터 소버린 AI, 피지컬 AI까지
- AI 창의성의 역설 - 평균은 넘었지만 천재는 못 따라간다
- 2026년 AI 코딩 주요 트렌드 - 자율 에이전트 루프부터 멀티 에이전트 오케스트레이션까지
- AI에게 창의적이라고 요청하지 마라 - 제약으로 창의성을 끌어내는 프롬프트 기법
- YaRN - LLM 컨텍스트 윈도우를 효율적으로 확장하는 방법
- DeepPlanning - 장기 계획 수립 에이전트를 위한 벤치마크
- Kimi K2.5 - Moonshot AI의 1조 파라미터 오픈 웨이트 멀티모달 모델
- 2026년 데이터 엔지니어링을 재편하는 5가지 AI 트렌드
- ChatGPT 사용 시 뇌에 축적되는 인지 부채(Cognitive Debt) - MIT Media Lab 연구
- vLLM Sleep Mode - 단일 GPU에서 다중 모델 전환을 위한 제로 리로드 솔루션
- Engram - 조건부 메모리 검색을 통한 LLM의 새로운 희소성 축
- DeepSeek-R1 - 강화학습을 통한 LLM 추론 능력 향상
- Inferact - vLLM 상용화 스타트업, 1.5억 달러 시드 투자 유치
- vLLM 메모리 누수 디버깅 - Heaps do lie
- OpenAI Codex Agent Loop - 에이전트 루프의 내부 동작 원리
- Claude Skills - AI 에이전트를 위한 확장 가능한 스킬 시스템
- Mantic.sh - AI 에이전트를 위한 맥락 인식 코드 검색 엔진
- AI 에이전트를 위한 좋은 스펙 작성법
- OpenAI Healthcare 출시 - ChatGPT Health와 OpenAI for Healthcare
- Open Responses - LLM 상호운용성을 위한 오픈 표준
- Copilot CLI Agents - VS Code에서 Claude와 Gemini 통합하기
- AI 모델 붕괴(Model Collapse) - AI가 AI를 학습하면 생기는 문제와 예방법
- Planning with Files - Manus 방식으로 AI 에이전트 컨텍스트 문제 해결하기
- claude-mem - Claude Code 세션 간 컨텍스트를 자동 보존하는 메모리 시스템
- Anthropic Labs - Claude의 최첨단 기능을 실험하는 새로운 팀
- Claude Cowork - 개발자를 넘어 모든 업무로 확장되는 AI 에이전트
- Claude의 Healthcare 및 Life Sciences 분야 진출
- Claude Research Plugin - 체계적인 리서치를 위한 범용 플러그인
- vLLM Semantic Router v0.1 Iris - MoM을 위한 시스템 레벨 라우터
- vLLM HaluGate - 토큰 레벨 환각 탐지 시스템
- OpenCode에서 Claude Code 연동 차단 - Harness OAuth 우회 종료
- vLLM Custom Logits Processors로 특정 언어 토큰 차단하기
- 바이브코딩을 하면서 과몰입(터널)에 빠지지 않고 진짜 몰입하는 법
- 주요 데이터베이스의 MCP 지원 현황과 활용
- Claude Code 제작자가 말하는 효과적인 활용법
- GLM-4.7 - 코딩 전문 LLM의 새로운 강자
- OpenCode - AI 기반 코딩 어시스턴트
- DeepResearch Bench의 RACE와 FACT 평가 방법
- GPT-OSS-120B MoE 모델에서 QLoRA 튜닝이 실패하는 이유와 NeMo의 해결책
- Claude Code로 LLM 파인튜닝하기 - HuggingFace Skills
- LangSmith vs Langfuse
- LLM 서빙 환경 구축하기 + 모니터링
- 바이브 코딩
- 추론 모델의 환상
- AI는 모든 문제를 해결할 수 있는가?
- PandasAI를 알아보자
- AGI 직전이라더니 내가 사용하는 AI는 왜 멍청할까?
- Ollama 사용 방법
- A2A란 무엇인가?
- MCP 보안 이슈