Google DeepMind has announced 'Genie 2', an AI model capable of generating interactive 3D worlds. This overcomes the limitations of the previous model, which was restricted to creating 2D worlds. Genie 2 can generate 3D environments from a single image prompt and create images in real-time based on player movement. It can model water, smoke, and physics effects, and supports first-person, third-person, and isometric perspectives. Notably, the model has the ability to remember and reconstruct elements that are out of the player's view. However, it currently has a limitation of maintaining a consistent world for up to 60 seconds. Google DeepMind plans to primarily use Genie 2 for training and evaluating other AI agents, and it could also serve as a tool for artists and designers to implement their ideas.
구글 딥마인드가 상호작용 가능한 3D 세계를 생성할 수 있는 AI 모델 '지니 2(Genie 2)'를 발표했다. 이는 2D 세계 생성에 한정되었던 이전 모델의 한계를 극복한 것이다. '지니 2'는 단일 이미지 프롬프트만으로 3D 환경을 생성하고, 플레이어의 움직임에 따라 실시간으로 이미지를 만들어낸다. 물, 연기, 물리 효과 등을 모델링할 수 있으며, 1인칭, 3인칭, 아이소메트릭 시점을 모두 지원한다. 특히 플레이어의 시야에서 벗어난 요소들을 기억하고 재구성할 수 있는 능력을 갖추고 있다. 그러나 현재는 최대 60초 동안만 일관된 세계를 유지할 수 있다는 한계가 있다. 구글 딥마인드는 '지니 2'를 주로 다른 AI 에이전트의 훈련과 평가에 활용할 계획이며, 아티스트와 디자이너들의 아이디어 구현 도구로도 사용될 수 있을 것으로 보고 있다.