OpenAI has not specifically disclosed what data it used to train its video-generating AI, Sora. However, some experts point out that Sora may have sourced data from Twitch streams and game walkthroughs. Sora was launched on Monday, allowing users to generate videos up to 20 seconds long in various aspect ratios and resolutions from text prompts or images. OpenAI mentioned that it trained the model on Minecraft videos when Sora was first revealed. Nevertheless, legal experts warn that these data sources could lead to potential legal issues in the future.
오픈AI가 비디오 생성 AI인 소라(Sora)를 훈련시키기 위해 어떤 데이터를 사용했는지 구체적으로 밝히지 않았다. 그러나 일부 전문가들은 '소라'가 Twitch 스트리밍과 게임 공략에서 데이터를 가져왔을 가능성이 있다고 지적하고 있다. 소라는 월요일에 출시되었으며, 사용자는 텍스트 프롬프트나 이미지를 통해 최대 20초 길이의 비디오를 다양한 종횡비와 해상도로 생성할 수 있다. 오픈AI는 소라를 처음 공개할 당시 마인크래프트 비디오를 기반으로 모델을 훈련했다고 언급한 바 있다. 다만, 법률 전문가들은 이러한 데이터 출처가 향후 법적 문제를 야기할 수 있다고 경고하고 있다.