새로운 AI 오디오 시스템 '새몬': 오디오를 넘어 소리까지 이해하는 인공지능 1. 새몬(SALMONN)이란? 새몬은 사람의 음성이나 소리, 음악과 같은 다양한 오디오 입력을 듣고, 이해하고, 추론할 수 있는 최신 인공지능(AI) 시스템입니다. 이 시스템은 단순히 음성을 텍스트로 전환하는 기존의 STT(음성 텍스트 전환) 방식을 넘어서, 다양한 유형의 오디오를 동시에 학습하고 이해하는 '오디오 전문' 멀티모달 아키텍처를 실현했습니다. 2. 새몬의 탄생 배경 벤처비트는 최근 중국 칭화대학교와 바이트댄스 연구진이 발표한 '새몬'에 관한 논문을 온라인 아카이브(arXiv)에서 소개했습니다. 이 논문에서는 새몬의 기술적 세부사항과 그 특별한 기능에 대해 상세히 설명하고 있습니다. 3. 새몬의 주요 특징 1. 멀..