vLLM 5 vLLM Sleep Mode - 단일 GPU에서 다중 모델 전환을 위한 제로 리로드 솔루션 2026/01/30 vLLM 메모리 누수 디버깅 - Heaps do lie 2026/01/28 vLLM Semantic Router v0.1 Iris - MoM을 위한 시스템 레벨 라우터 2026/01/14 vLLM HaluGate - 토큰 레벨 환각 탐지 시스템 2026/01/13 vLLM Custom Logits Processors로 특정 언어 토큰 차단하기 2026/01/11