구글 딥마인드는 멀티모달 능력을 통합한 고급 AI 시스템인 제미나이 2를 공개했다. 실험적 프로젝트 아스트라(Astra)를 통해 선보인 제미나이 2는 스마트폰 카메라로 주변 환경을 해석하고 자연스럽게 대화를 나누며, 맥락에 맞는 추천을 제공한다. 예를 들어, 와인 병의 세부 정보를 분석하거나 그림에 대한 역사적 정보를 제공하고, 시를 실시간으로 번역하며 활용 가능성을 보여주었다. 제미나이 2는 구글 렌즈, 지도, 웹 검색 기능을 통합하고 사용자 선호도를 학습할 수 있는 메모리 기능을 갖췄다. 이 데이터는 삭제 가능하며, 사용자 맞춤형 추천 시스템으로 광고 및 상호작용 방식을 혁신할 가능성이 크다. 데모에서 제미나이 2는 높은 성능을 보였으나, 구글은 실제 사용에서의 개인정보 보호, 보안 문제 및 예측 불가능한 행동에 대한 과제가 남아 있음을 인정했다.
Google's DeepMind unveiled Gemini 2, an advanced AI system integrating multimodal capabilities, as part of its broader Gemini initiative aimed at competing with OpenAI's ChatGPT. Gemini 2, demonstrated through the experimental Astra project, can interpret its surroundings via a smartphone camera, converse naturally, and provide contextual recommendations. For instance, it identified wine bottle details, offered historical insights about paintings, and translated poetry on the fly, showcasing its potential as a versatile personal assistant. Gemini 2 combines Google Lens, Maps, and real-time web search with memory features, allowing it to learn users' preferences, though data can be deleted. The assistant is positioned as a sophisticated recommendation system that could revolutionize advertising and user interaction. While Gemini 2 performed well in controlled demonstrations, Google acknowledges challenges in privacy, security, and unpredictable real-world use.