OpenAI's recently unveiled o3 AI model has demonstrated groundbreaking performance improvements, opening up new possibilities for the AI industry. o3 achieved a score of 87.5% on the ARC-AGI general ability test, significantly outperforming other models. It also scored 25.2% on a challenging mathematics test where previous models couldn't surpass 2%. These achievements appear to be the result of a new method called 'test-time scaling', which involves using more computing power during the AI's response generation process. However, o3's high performance comes with substantial costs. The high-performance version of o3 used over $1,000 worth of compute for each task. This is a significant increase compared to the previous o1 model, which used around $5 of compute per task. Experts believe that while o3 has created an important breakthrough in AI development, its high costs mean it will likely be used more for critical decision-making and complex problem-solving rather than everyday applications.
오픈AI가 최근 공개한 o3 AI 모델이 획기적인 성능 향상을 보이며 AI 업계에 새로운 가능성을 제시했다. o3는 일반 능력 테스트인 ARC-AGI에서 다른 모델들을 크게 앞서는 88% 점수를 기록했으며, 기존 모델들이 2% 이상 득점하지 못한 어려운 수학 시험에서 25%의 점수를 얻었다. 이러한 성과는 '테스트 타임 스케일링'이라는 새로운 방법을 통해 이뤄진 것으로 보인다. 이 방식은 AI가 답변을 생성하는 과정에서 더 많은 컴퓨팅 파워를 사용하는 것이다. 그러나 o3의 높은 성능에는 상당한 비용이 따른다. 고성능 버전의 o3는 각 작업마다 1,000달러 이상의 컴퓨팅 비용을 사용했다. 이는 이전 모델인 o1이 작업당 약 5달러를 사용한 것과 비교해 큰 차이를 보인다. 전문가들은 o3가 AI 발전에 중요한 돌파구를 마련했지만, 높은 비용으로 인해 일상적인 사용보다는 중요한 의사결정이나 복잡한 문제 해결에 제한적으로 활용될 것으로 예상하고 있다.