DeepSeek-V3 기술 보고서 및 사용 가이드 아래 글은 DeepSeek-V3에 대한 기술 보고서 및 사용 가이드 내용을 한국어로 번역하고, 블로그 형식으로 재구성한 글입니다. DeepSeek-V3의 주요 특징, 모델 다운로드 방법, 다양한 평가 결과, 그리고 로컬에서 모델을 활용하는 방법 등을 한눈에 볼 수 있도록 정리했습니다.1. 소개 (Introduction)DeepSeek-V3는 전체 파라미터가 671B(이하 B는 109로 “억 개” 단위)이며, 각 토큰마다 37B가 활성화되는 강력한 Mixture-of-Experts(MoE) 언어 모델입니다.효율적인 추론(inference) 및 저비용 학습을 위해, DeepSeek-V3는 DeepSeek-V2에서 검증된 Multi-head Latent Att..