카카오브레인 '민달리', 명령 내리면 그림 그리는 AI

- 카카오브레인 ‘오픈 미니 컨퍼런스’ 성료, AI 연구 공유로 기술 상생 실현

카카오브레인이 최신 AI 연구 성과와 기술 노하우, 미래 비전 등을 외부에 공유하고 소통하는 자리를 가졌다.

카카오브레인은 지난 16일, 1,200여명이 참여한 가운데 온라인으로 진행한 ‘오픈 미니 컨퍼런스’를 성공적으로 마쳤다고 밝혔다. CEO 세션을 비롯해 다양한 기술 소개를 총 집합해 15개의 발표 세션, 3개의 디스커션 세션, CEO톡 등 총 19개 프로그램을 선보였다.

초거대 AI, 머신러닝, 메타버스 등 기술 소개를 비롯해 인재 영입, 비즈니스 소개 등 다양한 발표 세션을 진행했다. 최근 오픈소스로 공개한 초거대 AI 모델‘KoGPT(코지피티)’와 ‘minDALL-E(민달리)’가 특히 주목을 끌었다.

민달리, 질문 맥락 AI가 이해해 결과 값을 이미지로 도출

‘minDALL-E’는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 1,400만장의 텍스트와 이미지 세트를 사전 학습하고 13억개의 파라미터(매개변수, 학습 데이터 저장소)를 가지고 있다. 질문을 던졌을 때, AI가 맥락을 이해하고 이용자가 원하는 결과값을 바로 이미지로 도출한다. 검색을 통해 결과값을 찾아내는 것이 아니라 AI 스스로 명령을 이해하고 직접 이미지를 그리는 것이다.

카카오브레인 GM (Generative Model) 팀 김세훈 연구원은 ‘DALL-E: 인간과 기계가 언어로 소통하여 명화를 만들 수 있을까’라는 세션에서 ‘minDALL-E’를 활용해 명령을 내리고 그림을 그리는 과정을 실제로 선보였다.

김 연구원은 "OpenAI의 '달리'는 굉장히 혁명적인 모델이지만, 논문과 모델의 작은 부분만 공개되어 있다. 따라서, 많은 연구자 분들이 자연어 기반의 이미지 생성 모델에 대해 다양한 각도로 분석을 하고 싶은데 공개된 모델이 많지 않아 쉽지 않은 환경이라 생각했다. 연구자 분들의 아쉬움을 해소하기 위한 방법이 없을까 고민하다가 1,400만장의 이미지-텍스트 쌍으로 구성된 데이터셋을 학습한 달리를 공개했다"며 카카오브레인의 오픈소스를 통해 다양한 연구진의 기술 접근을 기대한다고 밝혔다.

카카오브레인이 온라인으로 개최한 오픈 미니 컨퍼런스에서 김일두 대표가 민달리를 소개하고 있다. (사진=카카오브레인)

김일두 대표, 초거대 AI 연구의 중요성 강조

카카오브레인 김일두 대표는 ‘앞으로 인공지능이 어떤 일들을 더 잘할 수 있을까요?’ 라는 세션에서 한국어 언어모델 ‘KoGPT’와 초거대 AI 기술 발전, 삶에 미치는 영향 등에 관해 설명했다.

김 대표는 “최근 한국어 언어모델을 오픈소스로 공개한데 이어, 향후 글로벌 최대 규모의 이미지 텍스트 멀티모달 데이터셋을 구축해 다양한 연구에 활용할 것” 이라는 계획을 밝혔다. 이와 함께 “언어모델은 챗봇 뿐 아니라 문서 검색, 요약, 분류 등 다양한 업무에 활용될 수 있다. 모델의 문제점과 단점을 카카오브레인과 함께 해결하고 극복하기 위해 고민했으면 한다”며 오픈소스를 활용해 초거대 AI 발전에 많은 파트너들이 함께 참여해 줄 것을 요청했다.

이번 컨퍼런스에는 AI 스타트업의 발표자도 함께했다. 헬스케어 분야의 ‘갤럭스’, 인공지능 반도체 분야의 ‘리벨리온’, MLOps 분야의 ‘레블업’ 대표들이 직접 세션을 진행했다. 최근 카카오브레인이 50억원을 투자하고 공동 연구 파트너십을 체결한 신약 설계 플랫폼 기업 ‘갤럭스’는 AI가 어떻게 바이오 데이터를 학습하고 생명현상을 이해할 수 있는지, 컴퓨터로 신약을 설계하고 난치병, 감염병 등을 치료하는 미래는 어떤 것인지에 관해 설명했다.

모든 세션이 종료된 후, 김일두 대표는 직접 내년 회사 비전과 방향을 직접 설명하는 ‘커티스(김일두 대표의 영이이름)톡’도 진행했다. 그 동안 생각하지 못했던 질문을 던져 세상을 변화시켜보자는 카카오브레인의 비전 ‘언띵커블 퀘스쳔(Unthinkable Question)’을 주제로 초거대 AI 연구의 중요성을 다시 한번 강조했다.

김 대표는 "카카오브레인은 차별화된 연구 기술을 선도해가면서 인식, 수많은 경우의 수 탐색을 넘어 추론과 기억, 사람같은 인공지능을 향해 도전하고 이 기술들이 세상에 중요한 문제에 쓰여지게 할 것" 이라며 “카카오브레인은 정제를 거친 20억건 수준의 이미지-텍스트 쌍으로 구성된 데이터를 기반으로 사람 같은 인공지능을 실현할 수 있도록 연구하고 있고, 이를 일부 공개해 AI 산업 전반에 기여할 수 있는 방안도 검토 중”이라고 밝혔다.

카카오브레인은 매년 오픈 미니 컨퍼런스를 개최해 다양한 주제로 활발히 소통할 수 있는 자리를 지속적으로 만들어 갈 계획이다. 이번 행사의 모든 발표 내용은 공식 홈페이지에서 확인할 수 있다.

김효정 기자

hjkim@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

팀뷰어가 전망하는 2025년 인공지능 발전 방향은?

이번 전망과 관련해 팀뷰어 측은 “AI가 주도하는 변화는 초기 징후를 보고 있지만 진정한 변화는 AI 기능들이 비즈니스 환경에 적용될 때 일어날 것”이라며 AI가 기술 지원을 위한 30초짜리 튜토리얼 비디오를 생성한다거나 교육을 위한 시각적 시뮬레이션을 만드는 등의 방식을 언급했다.  

딥엘이 전하는 2025년 주목해야 할 AI 트렌드… “맞춤형 전문 AI 솔루션의 시대가 온다”

딥엘의 주요 임원들은 내년에 AI가 단순한 툴을 넘어 협업하는 동료로 발전할 것으로 내다보며, 특정 분야에 전문성을 띤 맞춤형 AI 솔루션이 핵심 키워드가 될 것이라고 강조했다. 지금부터 딥엘 전문가들이 전하는 예측하는 2025년 AI 트렌드를 살펴본다.

아하 커뮤니티 앱 토론 결과, 윤석열 대통령 하야·탄핵 81% 찬성

윤석열 대통령의 향후 거취를 두고 정치권을 중심으로 논란이 가중되는 가운데, 소셜 Q&A 커뮤니티 아하에서 1주일 간 뜨거운 토론이 벌어져 관심을...

유튜브, 4,600만 사용자로 국내 모바일 앱 1위…AI·가상화폐 앱 급성장

유튜브가 2024년 하반기 국내 최다 이용 모바일 앱으로 집계됐다. 전체 순위를 보면 카카오톡(4,539만 명), 네이버(4,341만 명), 크롬(3,741만 명), 구글(3,682만 명)이 2위에서 5위를 차지했다. 이어서 쿠팡(3천160만명), 네이버지도(2천626만명), 삼성인터넷(2천268만명), 인스타그램(2천262만명), 배달의민족(2천166만명) 등이 이름을 올렸다.