‘오픈AI Vs. 오픈AI’ 메타의 ‘라마’ 유출이 던진 질문

[AI요약] 메타의 대규모 언어모델 라마의 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. 기술기업으로부터 강력하게 통제되는 기술이냐, 누구나 접근가능한 기술이냐, 우리는 AI 미래를 위한 교차로에 서 있다.

메타 라마의 이번 유출로 개방형AI와 폐쇄형AI에 대한 고찰이 이뤄지고 있다. (이미지=메타)

최근 메타(Meta)가 공개한 GPT 스타일의 인공지능(AI) 언어모델 ‘라마’(LLaMA)의 대규모 유출 현황과 전망에 대해 더가디언, 더버지 등 외신이 보도했다.

메타의 목표는 단순히 GPT를 복제하는 것이 아니다. 라마는 오픈AI(OpenAI)의 챗GPT, 구글의 람다(LaMDA) 등 경쟁 기업의 기술보다 작고 성능이 뛰어나면서 동일한 이해력을 실행하도록 개발됐다. 컴퓨팅 측면에서도 차지하는 공간이 작고 실행비용도 비교적 저렴하다는 것도 장점이다.

특히 메타는 라마를 ‘개방형’으로 만들었다고 강조하며, 기업의 이름과는 반대로 기술을 ‘오픈’하지 않은 오픈AI를 암시적으로 지적했다.

대규모 언어모델의 최근 발전에도 불구하고 그러한 모델을 교육하고 실행하는 데 필요한 리소스로 인해 전체 연구 액세스는 여전히 제한적이다. 이 제한된 액세스는 대규모 언어모델이 작동하는 방식과 이유를 이해하는 연구원의 능력을 제한하고 있다.

메타는 라마용 코드를 공유함으로써 다른 연구자들이 대규모 언어모델에서 이러한 문제를 제한하거나 제거하는 새로운 접근 방식으로 더욱 쉽게 테스트할수 있도록 했다. 메타는 연구원이 사용할수 있는 라마를 출시함으로써 학술 AI연구의 한계로 지적받아온 LLM을 교육하는 막대한 비용을 축소했다.

3년전 기준 GPT-3의 각 교육 실행비용은 1000만달러(약 130억3000만원)에서 1200만달러(156억 3600만원) 사이로 추정됐다. 오픈AI는 실제 비용을 공개하지 않고 개별 실행에 사용된 컴퓨팅 양만 공개했다. 또한 해당 분야의 시행착오 특성을 감안할 때 올바른 실행에 필요한 실행 횟수도 공개하지 않았다.

반면 메타는 효율성에 중점을 두어 시스템 운영 비용을 낮췄다. 가장 발전된 라마 모델은 650억개의 매개변수로, GPT-3의 가장 큰 크기의 3분의 1에 불과하지만 기능면에서 거의 동일한 것으로 평가받고 있다. 이렇게 축소된 크기는 라마를 훨씬 더 저렴하게, 심지어 데스크톱 컴퓨터에서도 실행할 수 있음을 의미한다.

문제는 누구나 다운로드할 수 있도록 전체 모델이 유출되면서 시작됐다. 최초 포챈(4Chan)에 게시된 라마는 비트토렌트를 통해 퍼졌고 결국 무료 깃 저장소인 깃허브(GitHub)에 게시됐다. 이를 게시한 사용자는 다른 사용자들에게 ‘대역폭을 절약’을 위해 해당 링크를 사용하도록 권장하는 메모를 추가하기도 했다.

이번 유출이 어떤 영향을 미칠지 말하기에는 너무 이를수 있다. 현재 이 모델을 사용하기 위해 심각한 기술적 결함을 안고 극도로 강력한 컴퓨터 또는 클라우드 스토리지 청구서에 엄청난 비용을 쓸 의지가 없다면 실질적으로 사용할 수는 없기 때문이다.

라마 유출에 메타의 반응도 불분명하다. 메타가 변호사를 통해 ‘지니를 다시 병속에 집어넣을 것’인지, 아니면 라마가 세계에서 가장 널리 배포된 AI가 될 가능성이 있는 이번 상황을 지켜보며 개발자로서의 우연한 역할을 받아들인 것인지 아직 모르기 때문이다.

이번 라마 유출에 우리는 현재 매우 다른 두 가지 AI 미래의 교차로에 서 있다. 하나는 이러한 모델을 교육하고 개선하는 데 수십억 달러를 투자하는 회사가 게이트키퍼 역할을 하며 모델이 가능하게 하는 경제 활동의 일부를 차단하는 것이다. 예를 들어 챗GPT를 기반으로 비즈니스를 구축하고 싶다면 비용을 지불하면 된다.

다른 하나는 AI 모델을 누구나 접근할수 있도록 구축하는 것이다. 혜택의 일부는 여전히 전문 지식과 서비스를 판매할 수 있는 위치에 있는 개발자에게 발생하지만, 일부는 인프라 공급자에 의해 더 많은 혜택을 받는다. 그러나 게이트키퍼가 줄어들면서 경제적 이점이 훨씬 더 확산된다. 두가지 미래 모두 장·단점이 있다.

라마 유출후 메타 대변인은 “최첨단 AI 모델을 연구 커뮤니티 구성원과 공유하여 해당 모델을 평가하고 개선하는 데 도움을 주는 것이 메타의 목표”라고 말했다. 또한 대변인은 “라마는 이전의 대규모 언어모델을 공유한 방식과 마찬가지로 연구 목적으로 공유됐다”며 “모든 사람이 모델에 액세스할수 없고 일부는 승인 프로세스를 우회하려고 시도했지만 현재 릴리스 전략을 통해 기업이 책임과 개방성의 균형을 유지할 수 있다고 본다”고 설명했다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

AI부터 암호화폐까지 ‘트럼프 2기’ 변화할 핵심 ‘기술 정책’

도널드 트럼프가 백악관으로 복귀하고 공화당이 양원을 장악하면 의심할 여지 없이 기술 분야가 재편될 것으로 보인다. 트럼프의 미국 우선주의 철학과 함께, 규제보다 혁신에 기반한 그의 행정부 정책은 AI, 사이버 보안 및 기타 핵심 기술 정책 분야의 글로벌 역학을 크게 바꾸면서 급속한 기술 발전을 촉발할 것으로 예상되고 있다.

스타워즈에서 영감을 받은 킬러 위성이 등장했다

조지 루카스 감독의 스타워즈(1977)에 등장한 ‘데스스타’(죽음의 별)는 가상의 우주 정거장이자 슈퍼무기다. 이 영화에 영감을 받은 중국 과학자들이 실제로 ‘데스 스타’를 만들었다. 스타워즈에서 영감을 받은 이 무기는 마이크로파 빔을 집중시켜 적의 위성을 쓸어버린다.

[마루에서 만난 사람] 이혜환 메텔 COO “B2B 분야의 마케팅 성과 측정이 가능한 수요 창출 엔진을 만들고 있습니다”

메텔이 무대로 삼는 것은 글로벌 최대 B2B 플랫폼, 링크드인이다. 이들은 생성형 AI 기술을 접목해 B2B 고객 발굴에 특화된 콘텐츠 자동화 솔루션을 개발하고 있다. B2B 기업과 그 고객의 페르소나를 분석하고 이를 자동화해 명확한 정체성을 담으면서도 고객의 반응을 끌어낼 수 있는 콘텐츠 마케팅을 가능하게 하겠다는 것이다. 더 나아가 이들은 그간 막연히 추정만 가능했던 B2B 마케팅의 성과 측정까지 가능한 솔루션을 개발 중이다.

실리콘밸리 이민법 전문 변호사 주디 장, “트럼프 2.0시대 미국 진출 스타트업 비자 발급 쉽지는 않겠지만...”

트럼프 2.0시대를 앞두고 현지 창업을 준비하는 한국 예비 창업자 혹은 미국 진출이나 플립(FLIP, 본사 해외이전)을 고려하는 한국 스타트업은 다급해지고 있다. 이번 미 대선에서 트럼프 측이 강력한 이민정책으로 이민자를 줄이겠다는 공약을 내세웠기 때문이다. 트럼프 집권 1기 당시를 복기했을 때도 확실한 사실 하나는 트럼프 2.0시대에 미국으로 가려는 이민자 혹은 외국인들의 비자 발급이 굉장히 까다로워질 것이라는 점이다.