Google announced the release of Gemini 1.5 Pro, the latest addition to its Gemini GenAI model family, designed to process a significantly larger amount of data compared to its predecessor. The new model can handle about 700,000 words or 30,000 lines of code, which is 35 times the capacity of Gemini 1.0 Pro. Beyond text, Gemini 1.5 Pro can also ingest up to 11 hours of audio or an hour of video in various languages. However, the version accessible to most developers and customers, currently in limited preview, can process only around 100,000 words at once. The large-data-input capability of Gemini 1.5 Pro is deemed "experimental" and is available only to developers in a private preview through Google's GenAI development tool, AI Studio. Google is continuing to optimize the model, already testing a version with a 10 million-token context window. Gemini 1.5 Pro promises to enable a range of tasks, such as analyzing entire code libraries, "reasoning across" lengthy documents, maintaining extended conversations with chatbots, and analyzing and comparing video content comprehensively.
구글이 '제미나이 1.5 프로' 모델을 발표했다. 이 모델은 대량의 데이터를 처리할 수 있는 능력이 특징으로, 약 700,000단어나 30,000줄의 코드를 처리할 수 있으며, 이는 제미나이 1.0 프로가 처리할 수 있는 양의 35배에 해당한다. 또한, 텍스트뿐만 아니라 최대 11시간의 오디오나 1시간 분량의 비디오도 다양한 언어로 처리할 수 있다. 하지만 대부분의 개발자와 고객이 접근할 수 있는 제미나이 1.5 프로 버전은 한 번에 약 100,000단어만 처리할 수 있으며, 사설 프리뷰를 통해 승인된 개발자만이 AI Studio라는 구글의 GenAI 개발 도구를 통해 이를 시험해볼 수 있다. 구글은 제미나이 1.5 프로의 성능을 개선하기 위해 모델 최적화 작업을 계속하고 있으며, 이미 10백만 토큰 컨텍스트 윈도우를 가진 버전을 테스트 중이다. 이 모델은 전체 코드 라이브러리를 분석하거나 긴 문서를 추론하고, 챗봇과 긴 대화를 유지하며, 비디오 콘텐츠를 분석하고 비교하는 등 다양한 작업을 수행할 수 있다.