앤트로픽의 클로드 3, 평가테스트서 GPT-4 능가

For the first time, Anthropic's Claude 3 large language model (LLM) has outperformed OpenAI's GPT-4 on Chatbot Arena, a crowdsourced leaderboard. This marks a significant moment as variations of GPT-4 have consistently topped the chart since its inclusion. The success of Claude 3, along with Anthropic's smaller model Haiku, suggests a shift in the AI language model landscape, with top models now coming from a vendor other than OpenAI. The Chatbot Arena, operated by the Large Model Systems Organization, allows users to rate outputs from different LLMs, offering a platform to gauge AI models' effectiveness beyond traditional benchmarks. The competition among LLMs, including Google's Gemini Advanced, signifies a vibrant and evolving AI assistant space, with OpenAI expected to release a new successor to GPT-4 Turbo later this year.

엔트로픽의 클로드 3(Claude 3) 대규모언어모델(LLM)이 처음으로 챗봇 아레나(Chatbot Arena)에서 오픈AI의 GPT-4를 능가했다. 이는 지난 1년 넘게 챗봇 아레나의 정상 자리를 지켜온 GPT-4의 패배를 의미하며, 앤트로픽의 클로드 3가 더 자연스럽고 매력적인 대화를 수행할 수 있다는 것을 보여준다. 대규모모델 시스템 조직(Large Model Systems Organization)이 운영하는 챗봇 아레나는 사용자가 다양한 LLM의 출력을 평가하게 하여 전통적인 벤치마크를 넘어서 AI 모델의 효과를 가늠할 수 있는 플랫폼이다. 구글의 제머나이 어드밴스를 포함한 LLM 간의 경쟁이 치열해지며 오픈AI는 올해 후반에 GPT-4 Turbo의 새로운 후속 모델을 출시할 것으로 예상된다.

“The king is dead”—Claude 3 surpasses GPT-4 on Chatbot Arena for the first time

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

미국, 영국, EU, 첫 국제 AI 조약 서명 예정

Countries participating in the negotiations, including the United States, the United Kingdom, and European Union (EU) member states, are expected to sign the first legally binding international AI treaty.

中 전기차 니오, 2분기 수익 전년 대비 98.9% 증가... 주가 14% 폭등

The stock price of Chinese electric vehicle manufacturer Nio is soaring. Nio announced that its second-quarter revenue increased by 98.9% compared to the previous year, reaching $2.46 billion (approximately 3.2829 trillion won).

오픈AI, 챗GPT 기업용 유료 사용자 100만 명 돌파… 요금 인상 가능성

OpenAI announced that it has surpassed 1 million paid users just one year after launching the first business version of its generative AI-based chatbot.

구글 포토, AI로 진화하다... 'Ask Photos' 기능 출시

Google has announced that its AI-powered search feature, “Ask Photos,” first introduced at the I/O developer conference in May, will...