GLM-4.7 - 코딩 전문 LLM의 새로운 강자
목차 GLM-4.7 소개 주요 특징 성능 벤치마크 혁신적인 사고 메커니즘 사용 방법 주의사항 및 한계 GLM-4.7 소개 GLM-4.7은 Zhipu AI에서 개발한 코딩 전문 대규모 언어 모델입니다. 358B 파라미터의 MoE(Mixture of Experts) 아키텍처를 채택하여 효율적인 추론이 가능하며, MIT 라이...
목차 GLM-4.7 소개 주요 특징 성능 벤치마크 혁신적인 사고 메커니즘 사용 방법 주의사항 및 한계 GLM-4.7 소개 GLM-4.7은 Zhipu AI에서 개발한 코딩 전문 대규모 언어 모델입니다. 358B 파라미터의 MoE(Mixture of Experts) 아키텍처를 채택하여 효율적인 추론이 가능하며, MIT 라이...
목차 OpenCode란? 핵심 특징 설치 방법 기본 사용법 주요 명령어 고급 기능 CLI 명령어 설정 파일 권한 설정 개발 워크플로우 참고 자료 OpenCode란? OpenCode는 완전히 무료이고 소스 코드가 공개된 오픈소스 AI 코딩 에이전트다. 개발자가 자연어로 작업을 설명하면 AI가 코드를 생성...
VM 인스턴스 IP를 숨기고 Google Cloud Load Balancer를 통해 서비스를 운영하는 방법을 단계별로 안내합니다. 1. 사전 준비 # GCP 프로젝트 설정 확인 gcloud config set project {PROJECT_ID} # 사용할 리전/존 설정 gcloud config set compute/region asia-nort...
목차 개요 사전 준비 Docker 공식 저장소 설정 Docker 설치 Docker Data Root 설정 Containerd 설정 Docker 서비스 시작 사용자 권한 설정 설정 확인 트러블슈팅 마무리 참고 자료 개요 Docker는 컨테이너 기반 가상화 플랫폼으로, 애플리케이션을 신속하게 배포하고 관리...
Let’s Encrypt는 무료로 SSL/TLS 인증서를 발급해주는 비영리 인증 기관(CA)입니다. 이 글에서는 Let’s Encrypt의 작동 원리부터 실전 설정, 자동 갱신까지 모든 과정을 단계별로 알아보겠습니다. 목차 Let’s Encrypt란? 작동 원리 - ACME 프로토콜 Certbot 설치 Nginx에서 SSL 인증서 발...
Google Cloud Platform(GCP)에서 Identity-Aware Proxy(IAP)를 사용하면 공개 IP 없이도 안전하게 VM 인스턴스에 SSH 접속할 수 있습니다. 이 글에서는 IAP 터널링을 통한 SSH 접속 설정 방법을 단계별로 알아보겠습니다. 목차 사전 준비사항 IAP 설정 방법 로컬에서 IAP를 이용한 SSH 접속...
들어가며 LLM 기반 연구 에이전트(Deep Research Agents, DRAs)의 성능을 어떻게 평가할 수 있을까요? 단순히 텍스트 생성 품질만으로는 충분하지 않습니다. 연구 에이전트는 웹 탐색, 정보 수집, 분석, 그리고 인용이 포함된 종합 보고서 작성까지 수행해야 합니다. DeepResearch Bench는 이러한 복잡한 연구 에이전트를 ...
목차 GPT-OSS-120B는 Dense가 아닌 MoE 모델 Dense 모델과 MoE 모델의 근본적 차이 QLoRA × MoE 조합이 깨지는 지점 HuggingFace + PEFT 환경의 구조적 한계 그런데 왜 NVIDIA NeMo에서는 되는가? 결론 들어가며 대규模 언어 모델을 효율적으로 파인튜닝하기 위해 QLoRA는 매...