Microsoft has released its Phi-4 AI model as a fully open-source project on Hugging Face with an MIT license. The 14-billion parameter model outperforms larger models in mathematical reasoning and multilingual comprehension tasks. Trained on 9.8 trillion tokens, Phi-4 achieved over 80% scores in MATH and MGSM benchmarks, surpassing Google's Gemini Pro and GPT-4o-mini. The model's architecture focuses on efficiency and reasoning capabilities, while its open-source nature allows commercial applications. Microsoft's move signals a shift toward more accessible and efficient AI development, challenging the trend of scaling to massive model sizes.
마이크로소프트가 자체 개발한 AI 모델 'Phi-4'를 완전 오픈소스로 공개했다. 140억 개의 파라미터를 가진 이 소형 모델은 수학적 추론과 다중 언어 이해 분야에서 대형 모델들을 능가하는 성능을 보여준다. Phi-4는 MIT 라이선스로 허깅페이스에 공개되어 상업적 활용이 가능하며, 9.8조 개의 토큰으로 학습됐다. 특히 MATH와 MGSM 벤치마크에서 80% 이상의 점수를 기록하며 구글 제미나이 프로와 GPT-4o-mini를 뛰어넘는 성능을 보였다. 마이크로소프트는 이번 공개로 AI 모델의 효율성과 접근성을 높이겠다는 전략을 드러냈다.