구글 클라우드, 카카오브레인 AI 아티스트 모델 ‘칼로’ 머신러닝 학습 고도화

구글 클라우드는 카카오브레인이 구글 클라우드를 이용해 인공지능(AI) 아티스트 모델 ’칼로(Karlo)’의 머신러닝 학습을

고도화하고 초거대 AI 생태계 발전을 가속화한다고 15일 밝혔다.

칼로는 ‘민달리(minDALL-E)’, ‘RQ-트랜스포머(RQ-Transformer)’ 등 카카오브레인이 앞서 공개한 초거대 이미지 생성 AI 모델을 발전시켜 탄생한 AI 아티스트다. 대상, 화풍, 장소, 시간, 색상 등 원하는 제시어나 문장을 입력하면, AI가 스스로 이해한 맥락을 바탕으로 세상에 하나뿐인 이미지를 직접 생성할 수 있다.

카카오브레인은 메가존과 협력해 칼로의 머신러닝 모델을 학습시키는 데 구글 클라우드의 인프라와 솔루션을 적극 활용하고 있다. 칼로처럼 초거대 멀티모달(multi-modal) 데이터셋으로 반복 학습이 필요한 머신러닝 모델의 경우 대규모의 컴퓨팅 자원과 빠른 학습이 요구된다. 그러나 충분한 자원을 확보하고 빠른 성능을 유지할 수 있도록 이를 효과적으로 묶는 작업에는 어려움이 따른다. 연산 데이터를 관리하는 노드가 늘어날수록 상호 처리해야 하는 데이터 양이 많아져 병목 현상이 일어나기 때문이다.

구글 클라우드 GPU(Cloud GPU)는 업계에서 유일하게 엔비디아(NVIDIA)의 A100 GPU 16개를 단일 노드로 운영할 수 있다. 카카오브레인은 클라우드 GPU를 활용해 GPU 자원을 노드 당 16개까지 묶어 사용함으로써 병목 현상을 획기적으로 줄였다. 이를 통해 성능 손실을 최소화하고 컴퓨팅 효율을 강화했으며, 모델 개발 기간을 단축해 비용 역시 크게 절감할 수 있었다.

카카오브레인은 보다 건강하고 세상에 도움을 줄 수 있는 방향으로 생성 AI의 가능성을 확장하기 위해 구글 클라우드의 비전 API(Vision API)를 활용하고 있다. 비전 API는 이미지에 라벨을 할당하고 사전 정의된 수백만 개의 카테고리에 따라 이미지를 빠르게 분류한다. 칼로가 그린 그림의 맥락을 분석하고 사회적 기준에 부합하는지 실시간으로 파악해, 사용자에게 불편함을 줄 수 있는 그림을 사전에 방지한다. 

이외에도 클라우드 스토리지(Cloud Storage)에 학습 데이터를 저장 및 관리하고, 컴퓨트 엔진(Compute Engine)의 GPU 인스턴스(GPU Instance)를 학습에 활용하는 등 칼로가 그림을 그리는 방법을 학습하고 향상시켜 나가는 핵심 과정이 구글 클라우드 상에서 이뤄지고 있다. 카카오브레인은 칼로를 비롯한 여러 프로젝트를 진행함에 있어 안정적으로 자원을 수급하고 비용 효율성을 강화하기 위해 구글 클라우드와 장기 계약을 체결했다.

카카오브레인은 지난 11월 칼로를 활용해 상상을 그림으로 그려내는 국내 최초 AI 생성 앱 ‘B^ DISCOVER’를 글로벌 시장에 선보였으며, 이달 초 ‘칼로 1.0’ 모델을 세계 최대 오픈소스 커뮤니티 깃허브(GitHub)에 공개했다. 2023년에는 개선된 품질과 기능이 추가된 칼로 모델을 오픈 API 형태로 공개하며 사용자의 접근성을 더욱 높여갈 예정이다.

김세훈 카카오브레인 AI디렉터는 “칼로의 AI 모델은 지금도 계속해서 진화하고 있으며 학습에 수반되는 데이터셋 규모 역시 커지는 중”이라며 “앞으로도 구글 클라우드와 긴밀히 협력하며 카카오브레인이 그리는 초거대 AI 생태계 발전 여정을 함께 걸어나갈 것”이라고 밝혔다.

장화진 구글 클라우드 코리아 사장은 “언어 모델을 넘어 인간의 창의성과 가능성을 극대화하는 이미지 생성 AI 분야까지 협업을 확대하게 된 것을 매우 기쁘게 생각한다”며 “구글 클라우드는 업계 최고 수준의 AI 및 머신러닝 기술과 강력한 인프라를 기반으로 대규모 모델의 신속한 개발과 글로벌 서비스 확산을 지원한다. 앞으로도 국내 초거대 AI 생태계 조성 및 혁신에 더욱 힘을 보탤 것”이라고 말했다.

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

메디웨일, 망막AI로 ‘만성 폐쇄성 폐질환’ 조기 예측 가능성 확인…국제학술지 논문 게재

의료 인공지능(AI) 기업 메디웨일은 망막 이미지에서 측정한 생체 나이로 만성 폐쇄성 폐질환(COPD)의 위험을 예측할 수 있음을 입증한 연구를 발표했다고 18일...

엑스엘에이트-스트리밍코리아, AI 동시 통역 자막 ‘이벤트캣’ 국내 스트리밍 시장 공략

AI 기반 번역 및 자막 솔루션 기업 XL8(이하 엑스엘에이트)는 온라인 생중계 전문 기업 스트리밍코리아와 파트너십을 체결하고, AI 실시간 번역 자막...

모두싸인, 전남신용보증재단 ESG 경영 강화 위해 전자서명 공급으로 행정 디지털 전환 추진

전자서명 전문 기업 모두싸인은 전남신용보증재단(이하 재단)의 ESG(Environmental, Social, Governance) 경영 실현과 내부 행정 혁신을 위해 클라우드 기반 공공기관용 전자서명 서비스...

클라이온, 창업 3년 만에 흑자 전환…2025년 솔루션 사업화 '드라이브'

AI 클라우드 서비스 전문기업 클라이온은 창업 3년 만에 흑자전환에 성공했다고 17일 밝혔다. 클라이온은 2024년 매출 215억원을 달성하며 목표 대비 98%의...