NVIDIA has announced Fugatto, a new AI audio generation model. The model is notable for its ability to create unprecedented sounds. Fugatto can create, transform, and manipulate sounds using text and audio inputs. It can produce unique sounds like a trumpet barking or a saxophone meowing, and it can also generate high-quality singing voices from text prompts. Key features of this AI model include generating music snippets from text, modifying existing songs, changing voice characteristics, and creating entirely new sounds. Nvidia describes Fugato as “an all-around tool for sound.”
엔비디아가 새로운 AI 오디오 생성 모델 '푸가토(Fugatto)'를 발표했다. 이 모델은 전례 없는 소리를 만들어낼 수 있는 능력을 갖추고 있어 주목받고 있다. 푸가토는 텍스트와 오디오 입력을 사용해 소리를 생성, 변형, 조작할 수 있다. 트럼펫이 짖는 소리나 색소폰이 야옹거리는 소리 같은 독특한 음향을 만들어낼 수 있으며, 텍스트 프롬프트로 고품질의 노래하는 목소리도 생성 가능하다. 이 AI 모델의 주요 기능으로는 텍스트로 음악 스니펫 생성, 기존 노래 수정, 음성 특성 변경, 완전히 새로운 소리 생성 등이 있다. 엔비디아는 푸가토를 "소리를 위한 만능 도구"라고 설명했다.