Juho's Dev Note

공부하고 기록하고

홈
카테고리
태그
아카이브
정보

홈 카테고리 LLM

카테고리

LLM 95

pxpipe: 텍스트 컨텍스트를 PNG 이미지로 변환해 Claude Code 토큰을 줄이는 프록시 2026/07/07
다가오는 AI 마진 붕괴: GLM 5.2와 추론 경제학 2026/07/07
Claude Sonnet 5: Sonnet 등급으로 Opus급 에이전트 실행 2026/07/03
Claude Fable 5 재배포: 수출 통제 해제와 강화된 안전장치 2026/07/03
The Verification Horizon: 코딩 에이전트 보상에 은탄환은 없다 2026/07/02
Claude Fable 5와 Mythos 5 수출 통제 해제와 접근 복구 2026/07/02
Autodata: 합성 데이터를 스스로 만드는 에이전트 데이터 사이언티스트 2026/07/02
Transformer Explainer: 브라우저에서 GPT의 내부 동작을 시각화하다 2026/07/01
DSpark: 반자기회귀 생성과 신뢰도 기반 검증으로 speculative decoding 가속하기 2026/07/01
Wayfinder Router: 모델 호출 없이 결정론적으로 LLM을 라우팅하는 CLI 2026/06/30
PostTrainBench: AI 에이전트가 언어 모델을 post-train할 수 있을까 2026/06/29
Instruction Residuals: 지속 사전학습과 명령어 파인튜닝의 균형 2026/06/29
Frozen Multi-Token Prediction: Pixel에서 Gemini Nano 가속하기 2026/06/29
GPT-5.6 Sol/Terra/Luna 프리뷰: 새 모델 명명 체계와 사이버 안전 스택 2026/06/29
DeepSeek-V4-Pro-DSpark: speculative decoding을 더한 1.6T MoE 모델 2026/06/29
PAPO: 확산 LLM 추론을 위한 보상과 상태 정렬 강화학습 2026/06/27
Headroom: AI 에이전트 토큰을 60-95% 줄이는 컨텍스트 압축 도구 2026/06/25
Sakana Fugu: 프론티어 LLM을 지휘하는 학습된 오케스트레이터 2026/06/24
BIRD: 대규모 데이터베이스 기반 Text-to-SQL 평가 벤치마크 2026/06/23
Kimi K2.7 Code : 장기 코딩에 특화된 오픈 가중치 에이전트 모델 2026/06/19
GLM-5.2 : 1M 컨텍스트를 지원하는 완전 오픈 프런티어 모델 2026/06/19
DiffusionGemma : 확산 기반으로 더 빠른 텍스트 생성 2026/06/19
OpenPipe ART: 경험으로 학습하는 에이전트 강화학습 트레이너 2026/06/18
MTEB v3 리더보드: 느린 데모에서 본격 임베딩 벤치마크로 2026/06/16
HRM-Text-1B: 계층적 추론 모델 기반 1B 언어 모델 2026/06/16
자가진화 LLM 에이전트의 능력 붕괴: 경험 내재화를 다시 생각하다 2026/06/15
Self-Harness: LLM 에이전트가 스스로 실행 환경을 개선하는 프레임워크 2026/06/14
Gated DeltaNet-2: 선형 어텐션에서 삭제와 쓰기 게이트 분리 2026/06/14
DiffusionGemma - 병렬 텍스트 생성과 Diffusion 기반 언어 모델 2026/06/13
LLM 시각 가이드 Part 1 - 토크나이제이션과 임베딩 2026/06/13
LLM 평가의 맹점: Test-Time Compute를 측정에 포함해야 하는 이유 2026/06/12
Microsoft MAI-Code-1-Flash: 일상 개발자 워크플로우를 위한 코딩 모델 2026/06/11
claude-oceanus 유출 루머: 엔터프라이즈 전용 고가 모델이라는 주장 2026/06/11
Open Athena: LLM 사전학습을 3.6배 빠르게 만든 스택 2026/06/10
NVIDIA Nemotron-3-Ultra: 550B LatentMoE 추론 모델 2026/06/10
Gemma 4 12B: 인코더 없는 통합 멀티모달 모델 2026/06/06
에이전트 워크플로를 LLM 가중치로 컴파일하기: 100배 저렴한 지하 에이전트 2026/06/05
LLM 에이전트가 직접 학습 데이터를 만든다: 자율 에이전트 데이터 엔지니어링 2026/06/05
DNA3.0-35B-A3B: Dnotitia의 한국어 특화 MoE 비전-언어 모델 2026/06/04
Claude Opus 4.8: 정직성, 동적 워크플로우, 노력 제어 2026/06/04
하이퍼커넥트 LLM 설명 정책 - 정답 없는 문제를 반복적 합의로 푸는 5단계 접근법 2026/06/03
NuExtract3 - 4B 비전-언어 모델로 문서에서 JSON 추출과 마크다운 변환을 동시에 2026/06/01
TurboQuant 완전 정리 - 이론 최적에 근접한 KV 캐시·벡터 검색 양자화와 vLLM 실측 2026/05/31
Google, I/O 2026에서 Gemini 3.5 정식 공개 - 에이전트 성능과 새 구독 체계 2026/05/31
Qwen 3.5의 검열 회로 해부 - 가중치에 새겨진 국가 검열의 메커니즘 해석 2026/05/30
ELF: 임베딩 공간 Flow Matching 으로 디스크리트 확산 모델을 추월한 연속 언어 확산 2026/05/28
Model Merging Scaling Laws — 10,506개 병합 실험으로 도출한 LLM 병합 스케일링 법칙 2026/05/25
TTL Tech Note — 지식 증류와 LLM 사이즈 선택, 14B/32B/70B의 실전 기준 2026/05/25
Google, I/O 2026에서 새 Gemini 공개 예정 — GPT-5.5급, Mythos에는 못 미친다는 보도 2026/05/24
Meta Muse Spark 공개 — Superintelligence Labs의 첫 멀티모달 추론 모델 2026/05/23
Qwen3.7-Max 공개: 에이전트 시대를 겨냥한 알리바바의 프런티어 모델 2026/05/21
Cohere Command A+ 공개: W4A4 양자화로 단일 GPU에서 돌아가는 218B MoE 모델 2026/05/21
Code as Agent Harness: 코드를 에이전트 실행 기반으로 보는 새로운 관점 (서베이) 2026/05/21
LoPE 무의미한 Lorem Ipsum이 LLM 수학 추론을 끌어올리는 메커니즘 2026/05/19
Claude 90% 할인 중국 암시장의 정체와 AI 데이터 탈취 위험 2026/05/19
Bifrost: LiteLLM보다 50배 빠르다는 Go 기반 초고속 AI 게이트웨이 2026/05/17
TokenSpeed: 에이전트 워크로드를 위한 빛의 속도 LLM 추론 엔진 2026/05/16
DGX Spark에서 Qwen3.5-122B-A10B 추론 80% 가속: INT4+FP8 하이브리드와 MTP-2 투기적 디코딩 2026/05/12
Multiagent Debate - 다중 에이전트 토론으로 LLM 사실성과 추론 향상 2026/05/10
Gemma 4 Multi-Token Prediction - 품질 손실 없이 최대 3배 추론 가속 2026/05/10
ECE7115, 인하대 Multimodal VLM 강의가 Stanford CS336을 따라가는 법 2026/05/07
DeepSeek-V4 패밀리 공개, Flash와 Pro 그리고 1.6T 베이스 모델 2026/05/06
GLM-5 Scaling Pain: PD 분리 KV 캐시 race, HiCache 동기화 누락, LayerSplit가 풀어낸 코딩 에이전트 서빙의 진짜 병목 2026/05/05
DeepSeek-V4-Pro 공개 - 1.6T MoE, 49B 활성 파라미터, 1M 컨텍스트, FP4/FP8 혼합 정밀도 2026/04/30
Needle In A Haystack: 장문 컨텍스트 LLM의 검색 능력을 재는 벤치마크 2026/04/26
Claude Opus 4.7 개발자 리뷰: 마이그레이션 체크리스트와 Breaking Changes 2026/04/26
Kimi K2.6 공개: 1T MoE 오픈소스 모델의 에이전틱 코딩 도약 2026/04/25
Qwen3.6-35B-A3B: 350억 파라미터 MoE 모델, 30억만 활성화하는 에이전틱 코딩 오픈소스 2026/04/22
SuperGemma4 26B Uncensored MLX 4bit v2 - Apple Silicon용 고속 로컬 에이전트 모델 2026/04/21
MiniMax-M2.7 자기 진화하는 오픈 웨이트 모델과 공식 CLI 2026/04/19
Gemma 4 로컬 모델로 Codex CLI 돌려보기 실전 테스트 2026/04/18
NVIDIA·MIT TriAttention, KV 캐시 메모리를 10배 줄이다 2026/04/16
LG EXAONE 4.5 33B: 한국어 특화 첫 오픈 비전-언어 모델 2026/04/16
LM Studio CLI로 Google Gemma 4 로컬 실행: M4 Pro에서 51 tok/s 달성 2026/04/09
LiteLLM PyPI 공급망 공격 - 악성 코드 삽입 보안 사건 분석 2026/03/31
LLM을 컴퓨터로 만들기 - 트랜스포머 내부에서 프로그램을 실행하는 방법 2026/03/24
Trie 기반 빔 서치 - LLM 디코딩의 메모리와 속도를 동시에 잡다 2026/03/23
llmfit - 내 하드웨어에 맞는 LLM 모델을 찾아주는 터미널 도구 2026/03/21
LLM Architecture Gallery - 43개 LLM 아키텍처를 한눈에 비교하는 갤러리 2026/03/21
LLM으로 소프트웨어를 만드는 방법 - 아키텍트-개발자-리뷰어 다중 에이전트 워크플로우 2026/03/20
LLM 신경해부학: 가중치 변경 없이 중간 레이어 복제로 리더보드 1위 달성 2026/03/18
Claude Opus 4.6 & Sonnet 4.6 - 1M 컨텍스트 윈도우 정식 출시 2026/03/17
프롬프트의 정중함이 LLM 정확도에 미치는 영향 - Mind Your Tone 논문 분석 2026/03/14
Deep Think with Confidence - LLM 추론의 신뢰도 평가 연구 2026/03/14
GPT-5.4의 1M 컨텍스트 윈도우, 기본 설정으로는 258K만 사용 가능 2026/03/12
Qwen3.5 - 알리바바의 새로운 대규모 언어 모델 시리즈 2026/03/07
YaRN - LLM 컨텍스트 윈도우를 효율적으로 확장하는 방법 2026/02/01
Inferact - vLLM 상용화 스타트업, 1.5억 달러 시드 투자 유치 2026/01/29
vLLM Custom Logits Processors로 특정 언어 토큰 차단하기 2026/01/11
GLM-4.7 - 코딩 전문 LLM의 새로운 강자 2026/01/06
DeepResearch Bench의 RACE와 FACT 평가 방법 2025/12/23
GPT-OSS-120B MoE 모델에서 QLoRA 튜닝이 실패하는 이유와 NeMo의 해결책 2025/12/22
LangSmith vs Langfuse 2025/12/14
LLM 서빙 환경 구축하기 + 모니터링 2025/10/04
AGI 직전이라더니 내가 사용하는 AI는 왜 멍청할까? 2025/04/30

최근 업데이트

다가오는 AI 마진 붕괴: GLM 5.2와 추론 경제학
Anthropic이 개발자 신뢰를 잃는 방법: 과금과 벤더 락인 비판
대부분이 모르는 Claude 기능 총정리: 17가지 활용 가이드
Microsoft AI Agents for Beginners: AI 에이전트 입문 12강 무료 코스
pxpipe: 텍스트 컨텍스트를 PNG 이미지로 변환해 Claude Code 토큰을 줄이는 프록시

인기 태그

AI LLM Agent Benchmark Python Dev Security Evaluation Skill OpenAI

© 2026 juho park. 일부 권리 보유

Powered by Jekyll with Chirpy theme

인기 태그

AI LLM Agent Benchmark Python Dev Security Evaluation Skill OpenAI