구글 클라우드는 카카오브레인이 구글 클라우드를 이용해 인공지능(AI) 아티스트 모델 ’칼로(Karlo)’의 머신러닝 학습을
고도화하고 초거대 AI 생태계 발전을 가속화한다고 15일 밝혔다.
칼로는 ‘민달리(minDALL-E)’, ‘RQ-트랜스포머(RQ-Transformer)’ 등 카카오브레인이 앞서 공개한 초거대 이미지 생성 AI 모델을 발전시켜 탄생한 AI 아티스트다. 대상, 화풍, 장소, 시간, 색상 등 원하는 제시어나 문장을 입력하면, AI가 스스로 이해한 맥락을 바탕으로 세상에 하나뿐인 이미지를 직접 생성할 수 있다.
카카오브레인은 메가존과 협력해 칼로의 머신러닝 모델을 학습시키는 데 구글 클라우드의 인프라와 솔루션을 적극 활용하고 있다. 칼로처럼 초거대 멀티모달(multi-modal) 데이터셋으로 반복 학습이 필요한 머신러닝 모델의 경우 대규모의 컴퓨팅 자원과 빠른 학습이 요구된다. 그러나 충분한 자원을 확보하고 빠른 성능을 유지할 수 있도록 이를 효과적으로 묶는 작업에는 어려움이 따른다. 연산 데이터를 관리하는 노드가 늘어날수록 상호 처리해야 하는 데이터 양이 많아져 병목 현상이 일어나기 때문이다.
구글 클라우드 GPU(Cloud GPU)는 업계에서 유일하게 엔비디아(NVIDIA)의 A100 GPU 16개를 단일 노드로 운영할 수 있다. 카카오브레인은 클라우드 GPU를 활용해 GPU 자원을 노드 당 16개까지 묶어 사용함으로써 병목 현상을 획기적으로 줄였다. 이를 통해 성능 손실을 최소화하고 컴퓨팅 효율을 강화했으며, 모델 개발 기간을 단축해 비용 역시 크게 절감할 수 있었다.
카카오브레인은 보다 건강하고 세상에 도움을 줄 수 있는 방향으로 생성 AI의 가능성을 확장하기 위해 구글 클라우드의 비전 API(Vision API)를 활용하고 있다. 비전 API는 이미지에 라벨을 할당하고 사전 정의된 수백만 개의 카테고리에 따라 이미지를 빠르게 분류한다. 칼로가 그린 그림의 맥락을 분석하고 사회적 기준에 부합하는지 실시간으로 파악해, 사용자에게 불편함을 줄 수 있는 그림을 사전에 방지한다.
이외에도 클라우드 스토리지(Cloud Storage)에 학습 데이터를 저장 및 관리하고, 컴퓨트 엔진(Compute Engine)의 GPU 인스턴스(GPU Instance)를 학습에 활용하는 등 칼로가 그림을 그리는 방법을 학습하고 향상시켜 나가는 핵심 과정이 구글 클라우드 상에서 이뤄지고 있다. 카카오브레인은 칼로를 비롯한 여러 프로젝트를 진행함에 있어 안정적으로 자원을 수급하고 비용 효율성을 강화하기 위해 구글 클라우드와 장기 계약을 체결했다.
카카오브레인은 지난 11월 칼로를 활용해 상상을 그림으로 그려내는 국내 최초 AI 생성 앱 ‘B^ DISCOVER’를 글로벌 시장에 선보였으며, 이달 초 ‘칼로 1.0’ 모델을 세계 최대 오픈소스 커뮤니티 깃허브(GitHub)에 공개했다. 2023년에는 개선된 품질과 기능이 추가된 칼로 모델을 오픈 API 형태로 공개하며 사용자의 접근성을 더욱 높여갈 예정이다.
김세훈 카카오브레인 AI디렉터는 “칼로의 AI 모델은 지금도 계속해서 진화하고 있으며 학습에 수반되는 데이터셋 규모 역시 커지는 중”이라며 “앞으로도 구글 클라우드와 긴밀히 협력하며 카카오브레인이 그리는 초거대 AI 생태계 발전 여정을 함께 걸어나갈 것”이라고 밝혔다.
장화진 구글 클라우드 코리아 사장은 “언어 모델을 넘어 인간의 창의성과 가능성을 극대화하는 이미지 생성 AI 분야까지 협업을 확대하게 된 것을 매우 기쁘게 생각한다”며 “구글 클라우드는 업계 최고 수준의 AI 및 머신러닝 기술과 강력한 인프라를 기반으로 대규모 모델의 신속한 개발과 글로벌 서비스 확산을 지원한다. 앞으로도 국내 초거대 AI 생태계 조성 및 혁신에 더욱 힘을 보탤 것”이라고 말했다.
소셜댓글