서울 반포 메리어트호텔 그랜드볼룸에서 20일 국내외 AI 석학을 비롯한 한국과 영국 정부 관계자, 글로벌 빅테크 AI 전략 담당자들이 모여 인사이트를 공유하는 ‘초거대 인공지능이 바꾸는 미래(H.A.F Conference 2023)’ 컨퍼런스가 성대한 막을 올렸다.
매경이코노미, 앤서링 AI 기업 ‘포티투마루’가 주최하고 테크 전문매체 ‘테크42’가 주관하는 이번 컨퍼런스는 향후 인간을 넘어선 지식과 전문성을 갖춘 ‘초거대 AI’의 등장을 앞두고 산업 각 분야는 물론 세계 사람들의 일상에까지 일어날 변화와 혁신을 진단하는 자리다.
이날 오전 10시부터 단일 트랙으로 진행된 ‘초거대 인공지능이 바꾸는 미래’ 컨퍼런스는 임상균 매경이코노미 주간국장의 개회사를 시작으로 ‘초거대 AI의 도래와 미래 전략’을 주제로 한 카이스트 김진형 명예교수의 키노트 스피치가 이어졌다.
오전 세션의 두 번째 스피커로는 AI와 산업용 사물인터넷(IoT) 기반 제조 최적화 솔루션을 선보이는 이스라엘계 글로벌 기업 ‘플래테인’의 Moshe BenBassat 회장이 ‘AI Driving the Future of Manufacturing’를 주제로 발표를 진행했다.
열기가 고조되는 가운데 이날 참여객들의 관심을 모은 또 다른 발표는 ‘초거대 AI 시대, 기업의 대응 방향’을 주제로 초거대 전문가 AI ‘엑사원’을 소개한 LG 배경훈 AI연구원장의 발표였다.
앞서 LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 초거대 멀티모달(Multimodal) AI '엑사원(EXAONE) 2.0'을 공개한 바 있다. 이는 지난 2021년 12월 공개한 ‘엑사원’의 진화된 버전이다. 이는 유니버스, 디스커버리, 아틀리에라는 세 가지 서비스 플랫폼으로 구분된다.
배 원장은 “오픈AI, 구글을 비롯해 많은 스타트업, 대학기관에서 LLM(거대 언어 모델) 연구를 진행하고 있다”며 “LG의 엑사원도 그 중 하나를 차지하고 있다”며 발표를 시작했다.
“각 산업 현장에서 필요한 초거대 AI가 개발되고 있지만 실제 큰 임팩트를 만들고 비즈니스적으로 성공한 사례는 많지 않습니다. 그럼에도 생성형 AI 시장은 굉장히 빠르게 발전하고 있죠. 보고된 자료를 보면 금융, 뱅킹 쪽 성장이 굉장히 크고, 헬스케어 분야에서도 높은 성장률을 보이고 있습니다. (이 분야에 대한) 글로버 빅테크의 경쟁도 심화되고 있습니다. 챗GPT가 탑재된 마이크로소프트의 빙챗이 높은 관심을 받고 있고, 어제 발표된 메타의 ‘라마2’도 있고요.”
생성형 AI의 이면 ‘환각 문제’… 고품질 데이터로 해결
사실 챗GPT 신드롬은 그 사이 주춤하고 있다. 실제 최근 챗GPT의 사용자 유입량이 줄어들고 있다는 소식이다. 혹자는 과거 ‘AI 스피커’와 같은 전철을 밟을 수도 있다고 전망하기도 한다.
이와 관련 배 원장은 “현재 생성형 AI는 환각 현상이 일어날 수밖에 없고, 때문에 생성형 AI가 답을 과연 신뢰할 수 있는 지에 대한 고민을 할 수밖에 없다”고 챗GPT의 한계를 지적하며 “저희(LG)는 신뢰성 있는 AI를 만들어야 비로소 실제 산업현장에 생성형 AI를 적용할 수 있다고 판단했다”고 엑사원의 개발 배경을 설명했다.
“(엑사원을 개발하는 과정에서)저희는 고품질의 데이터를 모으는데 어마어마한 시간을 들였습니다. 일반 웹 데이터를 퐇마해 논문, 특허, 서적 등의 데이터를 비롯해 파트너사와 계열사로부터 각 도메인에 특화된 전문 데이터를 모았죠. 가령 논문 특허의 경우 약 4500만건, 이미지와 텍스트 데이터는 3.5억장 이상입니다. 양으로 봤을 때 전체 적으로는 약 2조개의 토큰에 달하는 데이터를 확보하고 있습니다.”
신뢰도 높은 고품질 데이터로 생성형 AI의 환각 문제를 최소화한 LG는 다음으로 한국어 데이터와 영어 데이터를 동시에 모아 학습하는 ‘멀티 테스크 튜닝’ 과정을 거쳤다. 한국어 데이터량이 제한 적인 상황에서 택한 방식이었고, 결과적으로 이는 한국어의 성능을 월등하게 높이는 성과를 발휘했다. 그렇게 LG의 엑사원 2.0은 신뢰성 높은 전문지식을 추론하는 ‘유니버스(Universe)’, 새로운 과학적 사실을 탐구하는 ‘디스커버리(Discovery)’, 창의적인 영감을 제공하는 ‘아틀리에(Atelier)’ 등 3대 플랫폼으로 나눠 전문성을 강화했다. 배 원장은 각 플랫폼의 특성을 짚으며 발표를 이어갔다.
“엑사원 유니버스는 전문 문서 지식을 기반으로 세부적으로 살펴보고 종합적으로 추론하며 논리적 가고가 가능한 모델입니다. 일반적인 지식도 학습을 하지만, 과학적인 논문을 굉장히 많이 학습하다 보니 유창하게 답하는 것 뿐 아니라 사실에 입각해 정확한 답변을 하는데 총력을 기울였습니다.”
환각 해결… 답변의 신뢰성 100%가 되는 세상은?
이어 배 원장은 ‘세상 모든 문서를 잘 이해하고 답변의 신뢰성이 100%가 되는 AI가 등장하게 된다면 어떤 세상이 될까’라는 질문을 던지기도 했다. 그에 가장 근접한 것이 바로 ‘엑사원 디스커버리’다. 배 원장의 표현에 따르면 이는 ‘새로운 지식을 연구하거나 새로운 소재, 신약 등을 개발하는 개척자’들을 위한 것이다. 실제 배 원장이 시연을 하며 소개한 ‘엑사원 디스커버리’는 PDF 등으로 돼 있는 연구 논문 등의 텍스트와 표, 이미지 등을 추출해 변환한 다음 이를 기반으로 다은 방식의 연구 자료나 데이터와 합성해 예측하는 것까지 가능하다는 것이 특징이다.
이를 테면, 논문에 소개된 물질들의 분자 구조를 추출해 조합하고 새로운 첨가제 소재를 만드는 과정을 ‘엑사원 디스커버리’로 진행할 수 있다는 것이다. 이렇게 만들어 진 첨가제 소재가 유효한지 여부도 질문을 통해 답을 찾을 수 있다는 것이 배 원장의 설명이다.
“논문 등에서 추출한 정보로 사람이 원하는 분자 구조를 변경해서 실험을 하고, 그렇게 만들어진 구조로 새로운 합성 에측을 진행할 수 있죠. 실제 이 과정을 통해 새로운 첨가제 물질을 만들어 낸 사례도 있습니다. 이 과정은 불과 몇 분만에 이뤄진다는 것이 가장 큰 장점입니다. 이전까지 이러한 결과물을 만들어 내기 위해서는 3~3개월의 시간이 소요됐죠. 저희는 이와 같은 사례를 계열사와 파트너사를 통해 만들어 내는 것을 넘어 글로벌 시장에서도 상용화 사례로 만들어가고 있습니다.”
이어 배 원장은 “‘엑사원 아틀리에’는 세계 최대 이미지 거래 플랫폼인 ‘셔터스톡’를 비롯해 글로벌 출판사들과 상용화 계약을 체결했다”며 “앞으로도 지속적으로 법무, 의료, 심리상담, 창작, 학술연구 등 다양한 분야에 성공 사례를 만들고 의미 있게 사용돼야만 생성형 AI 기술이 진정으로 발전할 수 있을 것”이라고 강조했다. 발표 말미 배 원장은 ‘AI가 인류에 위협이 되는가?’라는 질문에 대한 본인의 생각을 밝히기도 했다.
“AI가 인류의 위협이 될 수도 있겠죠. 그런데 잘 생각해보면 현재 챗GPT도 그렇고 생성형 AI는 강화 학습 기반으로 사람의 피드백을 받습니다. 결국 사람의 의지에 따라서 AI 모델이 만들어 지는 거죠. 즉 인간이 어떻게 만들고 활용하는지에 따라 AI 기술은 핵폭탄이 될 수도 있고, 우리에게 유용한 에너지가 될 수도 있다고 생각합니다.”
소셜댓글