MoE 3 Qwen3-Coder-Next - 80B 파라미터 중 3B만 활성화하는 초희소 코딩 에이전트 모델 2026/02/06 Kimi K2.5 - Moonshot AI의 1조 파라미터 오픈 웨이트 멀티모달 모델 2026/02/01 GPT-OSS-120B MoE 모델에서 QLoRA 튜닝이 실패하는 이유와 NeMo의 해결책 2025/12/22