오픈AI가 수학, 과학, 프로그래밍 문제를 '추론'할 수 있는 새로운 AI 시스템 '오픈AI o3'를 공개했다. 현재 안전성 테스터들에게만 공개된 이 시스템은 주요 벤치마크 테스트에서 업계 최고 AI 기술들을 능가하는 성능을 보여줬다. 이는 올해 초 공개된 o1의 후속 버전으로, 프로그래밍 작업에서 20% 이상 향상된 정확도를 보이며 수석 과학자의 성능도 뛰어넘었다. 강화학습을 통해 개발된 이 시스템은 문제를 단계별로 분석하고 해결하는 방식을 채택했다.
일반 사용자 대상 서비스는 월 246만원($200)에 제공될 예정이며, 내년 초 개인과 기업에 출시될 계획이다. 구글도 이와 유사한 'Gemini 2.0 Flash Thinking Experimental'을 선보이며 AI 추론 경쟁이 가속화되고 있다. 다만 챗GPT와 같은 기반 기술을 사용하기 때문에 환각 현상 등의 한계는 여전히 존재한다.
OpenAI has unveiled its new AI system 'OpenAI o3', designed to reason through problems in math, science, and programming. The system, currently available only to safety testers, has outperformed leading AI technologies in benchmark tests across various skills. As a successor to o1, it shows over 20% improvement in programming tasks and even surpassed the company's chief scientist's performance. Developed using reinforcement learning, the system breaks down problems into manageable steps for solution.
The service will be priced at $200 monthly for professionals and is scheduled for release to individuals and businesses early next year. Google has also introduced similar technology called Gemini 2.0 Flash Thinking Experimental, intensifying the AI reasoning competition. However, being based on the same technology as ChatGPT, it still faces limitations such as hallucination issues.