메타, 전 세계 200개 언어 번역 가능한 오픈소스 모델 선봬

(사진=메타)

페이스북 운영사 메타(Meta)가 7일(현지시간) 새로운 인공지능(AI) 기반 오픈소스 번역 모델을 선보였다.

전 세계 200개의 언어를 상호 번역할 수 있는 대규모 번역 모델 'NLLB-200'이 주인공이다. NLLB는 'No Language Left Behind'의 약자로 어떤 언어라도 번역하겠다는 의지를 표현하고 있다.

메타는 NLLB-200 모델을 공익 및 교육적인 목적으로 공개한다고 밝혔다. 소스 공개를 통해 더 많은 프로젝트 참여자와 데이터를 확보하려는 목적이다. 특히 사용 인구가 많지 않은 지역별 언어까지 지원함으로 해서 번역 활용도를 높였다.

메타는 NLLB-200 모델을 각종 도구와 함께 데이터셋 모두 오픈소스로 공개했다. 더불어 번역 모델을 평가하기 위해 평가 벤치마킹 솔루션인 FLORES-200도 함께 개발, 공개했다. 메타 측 설명에 따르면, NLLB-200의 번역 품질이 타 번역 모델보다 평균 44% 더 높은 성능을 보여주는 것으로 알려졌다.

각 언어별로 소스를 내려받아 활용할 수 있으며, 200개의 언어에는 한글도 포함됐다. 메타는 다국어 AI 기반 번역 모델 개발을 2018년부터 시작했으며, 2020년 100개 언어 지원을 거쳐 올해인 2022년에 200개 언어를 지원하는 수준으로 발전시켰다.

추현우 기자

goodgle@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

미국 대선 여파…사용자들 ‘X’ 손절하고 ‘블루스카이’에 몰린다

미국 대선 이후 소셜 플랫폼 사용자들이 X에서 대거 이탈하고 경쟁사인 블루스카이에 합류하고 있다. 그동안 도널드 트럼프 대통령 당선자를 공개적으로 지지한 일론 머스크의 행보와 인종차별 및 성차별 등 유해한 게시물을 급격하게 증가하고 있는 것을 목격한 사용자들이 X를 이탈하고 있다는 분석이 나온다.

[인터뷰] 김충섭 퍼플아이오 CTO “마케터의 시간을 돌려주는 ‘AI 기반 온사이트 마케팅 SaaS 서비스’를 아세요?”

코드앤버터의 개발을 주도한 퍼플아이오의 김충섭 CTO는 지금은 개발자들이 일반적으로 쓰는 기술인 ‘도커’를 처음 한국에 소개한 사람이다. 개발 관련 블로그는 물론 팟캐스트, 유튜브 활동을 통해 기술로 세상의 문제 해결을 고민해 온 김 CTO는 코드앤버터를 ‘그로스 플랫폼’이라고 이야기한다. 고객들의 고충과 문제를 해결함으로써 고객의 성장을 돕는 플랫폼이라는 의미다. 그리고 그 가치는 지속적인 고도화를 통해 코드앤버터의 영역 확장으로 이어지고 있다.

‘AI 딥페이크 포르노’로부터 자신을 보호하는 법

합의되지 않은 실제 이미지가 공유되는 ‘리벤지 포르노’ 문제가 AI 기술 확산과 함께 누구나 딥페이크 포르노 희생자가 될수 있는 공포로 떠올랐다. 실제 개인이 노골적인 이미지를 만들거나 또는 누군가에게 이를 보낸적이 없더라도 누구나 딥페이크 포르노의 괴롭힘 대상이 될수 있다.

당신의 인체디지털트윈으로 최적의 암치료법 쪽집게처럼

의사가 당신에게 암이 있고 즉시 치료가 필요하다고 말했다고 상상해 보자. 의사는 최소한 두 가지 치료 방식을 제시하고 하나를 선택할 수...