페이스북 운영사 메타(Meta)가 7일(현지시간) 새로운 인공지능(AI) 기반 오픈소스 번역 모델을 선보였다.
전 세계 200개의 언어를 상호 번역할 수 있는 대규모 번역 모델 'NLLB-200'이 주인공이다. NLLB는 'No Language Left Behind'의 약자로 어떤 언어라도 번역하겠다는 의지를 표현하고 있다.
메타는 NLLB-200 모델을 공익 및 교육적인 목적으로 공개한다고 밝혔다. 소스 공개를 통해 더 많은 프로젝트 참여자와 데이터를 확보하려는 목적이다. 특히 사용 인구가 많지 않은 지역별 언어까지 지원함으로 해서 번역 활용도를 높였다.
메타는 NLLB-200 모델을 각종 도구와 함께 데이터셋 모두 오픈소스로 공개했다. 더불어 번역 모델을 평가하기 위해 평가 벤치마킹 솔루션인 FLORES-200도 함께 개발, 공개했다. 메타 측 설명에 따르면, NLLB-200의 번역 품질이 타 번역 모델보다 평균 44% 더 높은 성능을 보여주는 것으로 알려졌다.
각 언어별로 소스를 내려받아 활용할 수 있으며, 200개의 언어에는 한글도 포함됐다. 메타는 다국어 AI 기반 번역 모델 개발을 2018년부터 시작했으며, 2020년 100개 언어 지원을 거쳐 올해인 2022년에 200개 언어를 지원하는 수준으로 발전시켰다.
소셜댓글