카카오브레인의 AI아티스트 ‘칼로 1.0’… 다양한 화풍으로 세상에 단 하나뿐인 이미지 생성

AI 아티스트 ‘칼로’ 모델에 제시어 입력 시 생성된 샘플 이미지. (이미지=카카오브레인)

카카오브레인이 자체 개발한 AI 아티스트 ‘Karlo(이하 칼로)’ 모델을 공개하며 초거대 AI 생태계 발전 가속화에 힘을 보탠다.

1일 카카오브레인은 입력한 제시어를 바탕으로 고품질의 이미지를 빠르게 만들어내는 AI 아티스트 ‘칼로 1.0’ 모델을 세계 최대 오픈소스 커뮤니티 깃허브(GitHub)에 공개했다고 밝혔다.

카카오브레인에 따르면 ‘칼로’는 앞서 공개한 ‘minDALL-E’, ‘RQ-Transformer’ 등 초거대 이미지 생성 AI 모델을 발전시켜 하나의 페르소나로 재탄생한 AI 아티스트다. 1.2억장 규모의 텍스트-이미지 데이터셋을 학습하여, 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 세상에 단 하나뿐인 이미지를 생성할 수 있다.

예를 들어 “a man with a face of avocado, in the drawing style of Rene Magritte(르네 마그리트 화풍으로 그린 아보카도 얼굴을 한 남자)”라는 제시어를 입력하면 ‘칼로’가 제시어의 맥락을 이해하고 아보카도 얼굴을 한 남성의 모습을 르네 마그리트 화풍으로 상상하여 이미지를 그려낸다. 기존에 존재하던 이미지를 찾아내는 것이 아니라, AI가 스스로 제시어를 이해하고 직접 이미지를 생성해내는 것이다.

AI 아티스트 ‘칼로’의 활용 분야 또한 무궁무진하다.

카카오브레인 측은 “교육 및 발표 준비에 필요한 시각 자료 제작에 활용해 전달하고자 하는 메시지의 설득력을 높일 수 있고, 신규 브랜드 로고 디자인 및 구조물 디자인 등 고도의 창의성을 요하는 산업군에서 영감을 주는 예술 도구로 활용할 수도 있다”고 설명했다.

카카오브레인은 내년 초 개선된 품질과 기능이 추가된 ‘칼로’ 모델을 오픈 API 형태로 공개하며 사용자의 접근성을 높여갈 예정이다. 또한 지속적으로 텍스트-이미지 데이터셋 추가 학습을 진행하는 한편, 이미지에서 불필요한 부분을 자연스럽게 제거하거나 편집할 수 있는 ‘이미지 인페인팅(Image Inpainting)’, 기존 이미지를 보고 빛과 그림자, 주변 사물 등을 상상해 이미지를 확장할 수 있는 ‘이미지 아웃페인팅(Image Outpainting)’ 등 다양한 기능을 추가하며 모델의 성능을 고도화해 나갈 계획이다.

한편 카카오브레인은 지난 10월 AI 아티스트 ‘칼로’를 활용해 국내 최초 AI 이미지 생성 앱 ‘B^ DISCOVER’를 글로벌 시장에 무료 공개했다. 예술가들의 창작 활동을 지원하는 전문가용 버전은 내년 초 공개를 앞두고 있다.

김일두 카카오브레인 대표는 “이번에 공개한 칼로 모델로 AI 아티스트의 무궁무진한 가능성을 다방면에 활용할 수 있을 것”이라며 “앞으로도 카카오브레인은 세계적 수준의 AI 모델들을 오픈소스로 공개하며 AI 생태계 발전 가속화에 힘을 보탤 것”이라고 말했다.

황정호 기자

jhh@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

초기투자AC협회, 글로벌 엔젤투자 국제기구 WBAF와 협약 갱신

초기투자액셀러레이터협회(이하 협회)는 바레인의 수도 마나마에서 열린 2024 WBAF Global Congress에서 WBAF(World Business Angels Investment Forum)와 글로벌 파트너스 업무협약을 체결했다고 22일...

스노우플레이크, 마이크로소프트 파워 플랫폼 전용 커넥터 출시

글로벌 AI 데이터 클라우드 기업 스노우플레이크(Snowflake)는 미국 워싱턴주 시애틀에서 개최된 연례 개발자 컨퍼런스 마이크로소프트 이그나이트(Microsoft Ignite)에서 마이크로소프트 파워 플랫폼(Microsoft Power...

삼성전자, 차세대 AI '가우스2' 공개..."기존 오픈소스 모델보다 3배 빨라"

삼성전자가 자체 개발한 2세대 생성형 AI 모델 '삼성 가우스2'를 공개했다. 기존 오픈소스 AI 모델 대비 처리 속도가 최대 3배 빠르고, 다양한 형태의 데이터를 동시에 처리할 수 있는 것이 특징이다.

대화형 AI 에이전트 ‘젠투’, ‘98% 고객 붙잡는 커머스 전략’ 웨비나 개최

대화형 인공지능(AI) 에이전트 ‘젠투(Gentoo)’ 개발사 와들은 ‘이탈하는 98%의 고객을 붙잡는 온라인 커머스 성공 전략’을 주제로 웨비나를 개최한다고 21일 밝혔다. 와들...