챗GPT에 도전하는 한국의 토종 AI 모델들… 경쟁력은?

2023.08.09

[AI요약] 한국은 미국, 중국, 이스라엘과 더불어 세계에서 자체적인 초거대 AI를 개발·보유한 국가로 꼽힌다. 초거대 AI 기술 확보가 중요한 것은 이 경쟁이 단순히 새로운 먹거리를 선점하는 수준에서 끝나지 않기 때문이다. 한국 토종 빅테크들이 초거대 AI 생태계 구축에 나서는 것은 기술 자주권 확보를 위한 대의의 목적을 포함하고 있다. 그 선두에 있는 기업들이 네이버, 카카오, LG 등이다.

^{한국은 미국, 중국, 이스라엘과 더불어 세계에서 자체적인 초거대 AI를 개발·보유한 국가로 꼽힌다. 초거대 AI를 기반으로 한 생성 AI 기술 경쟁이 채 1년이 안된 극 초기 상황이라는 점을 고려했을 때 나름 경쟁력을 확보한 셈이다. (이미지=픽사베이)}

지난해 말 등장한 챗GPT는 생성 AI(인공지능) 시대를 열고 있다. 연이어 대항마로 등장한 구글의 바드, 메타의 라마 역시 놀라운 성능으로 드러내며 생성 AI 기술 선점 경쟁을 이어가고 있다. 그렇다면 우리나라는 어떨까?

일단 한국은 미국, 중국, 이스라엘과 더불어 세계에서 자체적인 초거대 AI를 개발·보유한 국가로 꼽힌다. 초거대 AI를 기반으로 한 생성 AI 기술 경쟁이 채 1년이 안된 극 초기 상황이라는 점을 고려했을 때 나름 경쟁력을 확보한 셈이다.

이와 같은 초거대 AI 기술 확보가 중요한 것은 이 경쟁이 단순히 새로운 먹거리를 선점하는 수준에서 끝나지 않기 때문이다. 생성 AI는 시작일 뿐 초거대 AI를 활용해 새로운 제품과 서비스를 만들어 낼 가능성은 무궁무진하다. 즉 초거대 AI는 미래 산업의 인프라 기술인 셈이다. 이는 극 초기 시기에 국내외 각 기업들이 자체적인 초거대 AI 생태계 구축에 뛰어드는 이유기도 하다.

실제 업계에서는 글로벌 빅테크 중심의 초거대 AI 생태계 구축을 방관할 경우 ‘AI 기술 종속’ 상황을 맞을 것이라는 위기 의식이 존재한다. 즉 한국 토종 빅테크들이 초거대 AI 생태계 구축에 나서는 것은 기술 자주권 확보를 위한 대의의 목적을 가지고 있기도 한 것이다.

그 선두에 있는 기업들로는 네이버, 카카오, LG 등을 꼽을 수 있다. SK텔레콤 역시 빼 놓을 수 없다. 그 외에 네이버 파파고 팀의 일원이 창업한 스타트업 업스테이지가 챗봇을 넘어 생성 AI 개발을 준비 중이라는 소식이 들린다.

네이버의 야심작 ‘하이퍼클로바X’

생성 AI를 시작으로 세상의 모든 앱들이 포함된 대화형 AI 인터페이스의 현실화를 언급하는 전문가들이 늘어나고 있다. 영화 ‘아이언맨’의 ‘자비스’와 같은 기능도 미래에는 가능해질 수 있다는 얘기다. 네이버가 오는 24일 선보이겠다고 예고한 ‘하이퍼클로바X’는 한국을 넘어 글로벌에서 승부를 보겠다는 네이버의 초거대 AI 전략의 시작이라 할 수 있다.

아직 구체적인 스펙은 공개되지 않았지만, 이미 그 베타 버전이라고 할 수 있는 하이퍼클로바가 다양한 영역에 적용되고 있는 상황임을 감안하면 예상을 뛰어 넘는 기능을 선보일 것이라는 기대가 업계에 존재한다.

이러한 네이버의 전략은 ‘독자적인 초거대 AI 생태계를 구축하는 것’에 집중 돼 있다. 글로벌 빅테크 중심의 생태계 구축이 가속화되고 있는 상황에서 이를 방관한다면 자칫 AI 기술 종속 상황에 직면하게 된다는 것이 네이버의 우려다. 그런 우려가 현실화될 경우 국내 모든 대화 데이터, 앱 실행 데이터, 개인정보 데이터들이 모두 글로벌 빅테크 기업들의 데이터베이스에 저장될 수도 있다.

네이버는 이러한 관점에서 AI의 편향성을 완화하는 데이터셋을 무료로 공개하고 있기도 하다. 생태계를 구축하겠다는 목적을 이루기 위해서는 ‘안전한 AI’를 만드는 것이 선결 과제이기 때문이다.

다시 본론으로 돌아가 ‘하이퍼클로바X’의 가장 큰 차별성은 ‘한국어’에 특화돼 있다는 점이다. 이는 네이버가 자사 포털 서비스를 통해 수년간 구축한 데이터에 기반한다. 여기에는 적어도 본진인 한국에서는 챗GPT에 밀리지 않겠다는 각오가 서려 있다.

네이버는 이러한 장점을 바탕으로 자사 플랫폼에서 활동하는 창작자, SME(중소상공인) 등을 위한 도구에 하이퍼클로바X를 적용한다는 방침이다. 이를테면 콘텐츠 제작 툴 ‘스마트에디터’에 적용하는 것이다. 하이퍼클로바X가 적용된 새로운 버전의 글쓰기 도구는 오는 9월 무렵 일부 블로그 창작자를 대상으로 테스트를 거친 후 서비스 개선과 함께 점진적으로 보급될 것으로 알려지고 있다.

이어 네이버는 SME를 위한 생상성 향상 AI 솔루션 개발도 검토 중이다. 하지만 이것은 시작에 불과하다. 하정우 네이버 AI Innovation 센터장은 “파트너십을 통해 공공을 비롯해 법률, 금융, 건설 등 다양한 기업과 기관이 보유한 데이터를 학습하고 바로 업무 생산성을 높이는 용도로 활용할 수 있도록 ‘하이퍼클로바X’를 준비하고 있다”고 밝힌 바 있다. 이는 ‘하이퍼클로바X’가 범용의 AI 서비스를 넘어 각 기업과 기관에 특화된 AI 솔루션으로서 활용도 가능하다는 것을 엿볼 수 있는 대목이다. 이와 같은 네이버의 B2B 시장 확장은 네이버 클라우드 플랫폼을 통해 서비스 중인 하이퍼스케일(Hyperscale) AI 도구 클로바 스튜디오에 하이퍼클로바X를 탑재한 버전으로 선보인다고 알려졌다. 역시 하이퍼클로바X 공개 이후 테스트를 거쳐 오는 10월경 공식 출시가 예고돼 있다.

그 외에도 서버 인프라를 하이퍼클로바X에 최적화해 고객사의 데이터센터 내부에 직접 설치하는 기업 맞춤형 하이브리드 클라우드 서비스인 ‘뉴로클라우드’를 비롯해 챗GPT와 같은 생성형 AI인 대화형 에이전트 ‘클로바X’ 역시 베타서비스로 선보인다.

네이버는 이에 그치지 않고 생성형 AI 기반 검색 서비스 큐(Cue:) 베타서비스도 오는 9월 공개한다는 계획이다. 역시 하이퍼클로바X를 기반으로 한 검색 특화 생성형 AI 서비스다. 이 모든 것이 올 하반기에 동시다발로 진행되는 일정들이다. 모든 과정을 거쳐 얻어진 데이터는 네이버의 넥스트 스텝인 글로벌 전략으로 이어질 것으로 전망된다.

카카오, ‘브래인 100X 프로그램’ 가동, ‘생성형 AI 얼라이언스’ 구축

최근 카카오브레인은 ‘칼로 100X 프로그램’에 한국어 특화 AI 언어 모델 지원 혜택을 더해 ‘브레인 100X 프로그램’으로 확대한다고 밝혔다.

카카오브레인의 자체 모델인 KoGPT(코GPT)와 Karlo(칼로)를 포함한 카카오브레인의 전방위적인 AI 역량을 활용해 국내의 다양한 파트너들과 생성형 AI 얼라이언스를 구축해 새로운 AI 경험을 선보인다는 것이다.

앞서 지난 3월 카카오브레인은 스타트업 기업의 성장을 위해 ‘칼로 100X 프로그램’을 출범했다. 지난달에는 6개 기업을 우선 선정해 국내 생성형 인공지능(Generative AI) 생태계 확장 및 혁신적인 생성 AI 모델 서비스 개발을 돕고 있다.

우선적으로 선정된 기업은 ▲콘텐츠/미디어 크리에이터를 위한 콘텐츠 수익창출 플랫폼 빌더 ‘미디어스피어’ ▲생성형 AI 포털 ‘뤼튼’ ▲미디어아트 공간 플랫폼 메타그라운드의 운영사 ‘메타팩토리’ ▲카메라 필터 플랫폼 ‘패러닷’ ▲비주얼 콘텐츠 생성 AI 딥테크 스타트업 ‘스모어톡’ ▲AI 기반 영상 생성/합성 기술 솔루션 B2B 스타트업 ‘웨인힐스브라이언트에이아이’다.

카카오브레인은 이미지 생성 AI 기술 ‘칼로’를 각 기업별로 활용해 차별화된 AI 경험을 제공하도록 돕는다. 특히 칼로 100X 프로그램을 통해 ▲최신 이미지 생성 AI 기술 ▲인프라 ▲전략적 투자 혜택을 제공한다는 방침이다.

‘칼로 100X 프로그램’에 선정된 각 기업은 미디어 삽화, 생산성 도구, 소셜 공유 이미지, 체험형 미디어, 영상 및 콘텐츠 생성 등 다양한 분야에 새로운 AI 경험을 누릴 수 있다. 일례로 이미 ‘스모어톡’은 지난달 13일부터 16일까지 개최된 아시아 최대 스트릿 아트 페스티벌&아트페어 ‘어반브레이크 2023’ 전시에서 칼로 2.0 API를 활용한 AI 이미지 생성 부스를 설치해 색다른 AI 경험을 선보였다.

이와 관련 김일두 카카오브레인 각자 대표는 “AI 기술 및 서비스 개발뿐 아니라 국내 AI 생태계 발전을 위해 다방면에서 노력을 기울이는 중”이라며 “최근 ‘칼로 100X 프로그램’을 통해 산업 전문성을 갖춘 다양한 스타트업을 지원하는 협력 구조를 만들어 나갈 것”이라고 강조했다.

LG의 초거대 전문가 AI ‘엑사원 2.0(EXAONE 2.0)

19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 배경훈 LG AI연구원장이 엑사원(EXAONE) 20을 발표하고 있는 모습.(사진=LG) — ^{LG AI연구원은 지난달 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 배경훈 LG AI연구원장이 초거대 멀티모달(Multimodal) AI '엑사원(EXAONE) 2.0'을 공개한 바 있다. (사진=LG)}

LG AI연구원은 지난달 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 초거대 멀티모달(Multimodal) AI '엑사원(EXAONE) 2.0'을 공개한 바 있다. 이는 지난 2021년 12월 공개한 ‘엑사원’의 진화된 버전이다. 이는 유니버스, 디스커버리, 아틀리에라는 세 가지 서비스 플랫폼으로 구분된다.

배경훈 LG AI연구원장은 ““현재 생성형 AI는 환각 현상이 일어날 수밖에 없고, 때문에 생성형 AI가 답을 과연 신뢰할 수 있는 지에 대한 고민을 할 수밖에 없다”고 챗GPT의 한계를 지적하며 “저희(LG)는 신뢰성 있는 AI를 만들어야 비로소 실제 산업현장에 생성형 AI를 적용할 수 있다고 판단했다”고 엑사원의 개발 배경을 설명한 바 있다.

LG가 엑사원을 개발하는 과정에서 가장 시간과 공을 많이 투입한 부분은 고품질의 데이터를 모으는 과정이었다. 이를 통해 LG는 일반 웹 데이터를 포함해 논문, 특허, 서적 등의 데이터를 비롯해 파트너사와 계열사 등 각 도메인에 특화된 전문 데이터까지 확보했다. 그 규모는 어머어마하다. 이를테면 논문 특허의 경우 4500만건, 이미지와 텍스트 데이터는 3.5억장 이상에 달하는 것으로 알려졌다. 전체적으로는 약 2조개의 토큰에 달하는 데이터다.

이러한 데이터 확보 노력은 초거대 AI의 고비용 이슈를 해결하기 위한 기초 작업으로 이후 LG는 대규모 언어모델(LLM)고 멀티모달 모델의 경량화, 최적화 신기술에 상당한 공을 들이기도 했다.

특히 신뢰도 높은 고품질 데이터로 생성형 AI의 환각 문제를 최소화한 LG는 다음으로 한국어 데이터와 영어 데이터를 동시에 모아 학습하는 ‘멀티 테스크 튜닝’ 과정을 거쳤다. 한국어 데이터량이 제한 적인 상황에서 택한 방식이었고, 결과적으로 이는 한국어의 성능을 월등하게 높이는 성과를 발휘했다. 그렇게 LG의 엑사원 2.0은 신뢰성 높은 전문지식을 추론하는 ‘유니버스(Universe)’, 새로운 과학적 사실을 탐구하는 ‘디스커버리(Discovery)’, 창의적인 영감을 제공하는 ‘아틀리에(Atelier)’ 등 3대 플랫폼으로 나눠 전문성을 강화했다.

^{지난달 20일 진행된 ‘초거대 인공지능이 바꾸는 미래(H.A.F Conference 2023)’ 컨퍼런스에서 소개된 엑사원의 3대 플랫폼. (사진=테크42)}

각 플랫폼의 기능을 예로 들자면 우선 ‘엑사원 디스커버리’의 경우 논문에 소개된 물질들의 분자 구조를 추출해 조합하고 새로운 첨가제 소재를 만드는 과정을 진행할 수 있다. 그렇게 만들어 진 첨가제 소재가 유효한지 여부도 질문을 통해 답을 찾을 수 있다.

엑사원 유니버스는 전문 문서 지식을 기반으로 세부적으로 살펴보고 종합적으로 추론하며 논리적 가고가 가능한 모델이다. LG에 따르면 일반적인 지식을 비롯해 과학적인 논문을 굉장히 많이 학습해 유창하게 답할 수 있다. 게다가 생성형 AI의 환각 문제를 최소화해 사실에 입각한 정확한 답변을 하도록 하는데 총력을 기울였다는 것이 LG의 설명이다.

이어 엑사원 아틀리에는 이미지를 이해할 수 있는 기능에 특화된 플랫폼이다. LG는 이를 통해 세계 최대 이미지 거래 플랫폼인 ‘셔터스톡’을 비롯해 글로벌 출판사들과도 상용화 계약을 체결한 상태다.

그 외에도 우리나라는 SK텔레콤의 A.(에이닷), KT의 초거대 AI 모델 ‘믿음(MI:DEUM)’이 지속적으로 진화를 거듭하고 있다.

^{'믿음'을 적용한 KT의 다양한 서비스. (사진=KT enterprise)}

특히 SK텔레콤은 최근 공개적으로 AI 컴퍼니’로 전환을 선포하며 도이치텔레콤(독일), e&(중동), 싱텔(아시아) 등 통신사들과 ‘글로벌 텔코 AI 얼라이언스’를 공식 출범했다. 주목할 것은 이들 기업이 각 사의 핵심 AI 역량을 기반으로 ‘텔코 AI 플랫폼’을 공동 개발하기로 합의한 부분이다. 텔코 AI 플랫폼은 향후 통신사별로 AI 에이전트를 개발하기 위한 핵심 거대언어모델(LLM: Large Language Model)의 공동 구축을 포함해 새로운 AI 서비스 기획에 중추적인 역할을 담당한다는 것이 SK텔레콤의 설명이다.

한편 지난 2020년부터 초거대 AI 내부 생태계를 구축해 온 KT는 초거대 AI ‘믿음’의 상용화에 박차를 가하는 상황이다. 이는 KT클라우드가 구축한 GPU 기반 AI 클라우드 인프라를 활용해 고도화되고 있다는 것이 KT의 설명이다. KT는 믿음을 활용해 ‘AI컨택센터 AICC 사업’에서 올해 1000억원 이상의 매출을 목표로 하고 있다. 이어 오는 2025년에는 ‘AI 커뮤니케이션 플랫폼 사업자’를 목표로 하고 있다.

#AI #KT #LG #SK텔레콤 #글로벌 텔코 AI 얼라이언스 #믿음 #생성형 AI 얼라이언스 #에이닷 #엑사원 #초거대 AI #카카오 #칼로 #코GPT #텔코 AI 플랫폼 #하이퍼클로바X

황정호 기자

jhh@tech42.co.kr

기자의 다른 기사보기

[인터뷰] 문경현 두번째바다 대표 “해수 하이드로포닉스 기술로 육상 김 양식 상용화, 올해 해낼 겁니다”

문경현 두번째바다 대표는 국내 몇 안되는 조류학 박사 출신이다. 김에 대한 집착은 그가 2015년 박사 과정을 마치고 한 식품 대기업이 연구소 품종개발 김파트에서 일하면서도 이어졌다. 자비까지 써가며 양식장을 돌아다니고 김 연구를 병행하면서 육상 김 양식의 필요성을 제기했지만, 당시만 해도 바다 김 양식 풍년이 들며 주목 받지 못했다. 하지만 현장의 목소리와 급변하는 바다 상태를 직접 확인해 온 그는 ‘가까운 미래에 현재 바다 양식 방식에 큰 문제가 닥칠 것’이라는 확신을 했다고. 고심 끝에 창업을 결심하고 회사를 나온 것이 2016년 말이었다.

인사이트42 테크놀로지