OpenAI has introduced a new AI model called 'o1', the first in a series of reasoning models designed to solve complex problems faster than humans. Released alongside a smaller, cheaper version, 'o1-mini', this model—rumored as the highly anticipated 'Strawberry'—is a step toward OpenAI's goal of human-like AI. While more adept at coding and multistep problem-solving than GPT-4o, o1 is slower and more expensive to use.
ChatGPT Plus and Team users gain access to o1 starting today, with wider availability planned. The model's training differs significantly from its predecessors, using reinforcement learning and a new optimization algorithm. OpenAI says o1 excels at tasks like solving math problems and code challenges, though it still struggles with factual knowledge.
o1 represents a key step toward autonomous systems, and OpenAI believes that reasoning is crucial for future breakthroughs in areas such as medicine and engineering.
오픈AI가 새롭게 발표한 AI 모델 'o1'은 복잡한 문제를 해결하는 데 특화된 첫 번째 '추론' 모델로, 사람보다 빠르게 답변할 수 있도록 설계되었다. 함께 출시된 'o1-mini'는 더 저렴한 버전으로, 두 모델 모두 '스트로베리(Strawberry)'로 불리며 많은 기대를 모았다. o1은 다단계 문제 해결과 코딩에서 이전 모델보다 뛰어난 성능을 자랑하지만, 더 느리고 비용이 높아 GPT-4o보다 비싸다. 이번 출시에서는 챗GPT Plus와 Team 사용자에게 먼저 제공되며, 이후 무료 사용자도 사용할 수 있게 될 예정이다.
o1의 훈련은 새로운 최적화 알고리즘과 데이터셋을 기반으로 하였으며, 기존 GPT 모델과 달리 스스로 문제를 해결하는 '강화 학습' 기법을 사용했다. 오픈AI는 o1이 수학 문제나 코딩에서 뛰어난 성능을 보이며, 잘못된 정보 생성(환각)이 줄어들었다고 밝혔다. 그러나 GPT-4o와 비교해 사실적 지식 처리에서는 부족한 부분이 있다.
o1은 인공지능 모델이 자율적으로 문제를 해결하는 미래를 향한 중요한 단계로 여겨지며, 특히 추론 능력에서 큰 진전을 보일 것으로 기대된다.