김민현 커먼컴퓨터 대표는 구글에서 AI를 개발할 땐 너무나 풍부하고 잘 구축된 공통 모듈 환경을 활용할 수 있었지만, 외부에서는 아무 것도 할 수 없다는 걸을 깨달았습니다.
이를 해결해 공동(common)의 컴퓨팅 환경을 만들고자, 커먼컴퓨터(Common Computer)를 창업했습니다. 80%에 달하는 AI 컴퓨팅 리소스를 공유해 개발 생태계를 바꾸려는 커먼컴퓨터의 도전을 방수용 COO를 통해 들었습니다.
Q. 커먼컴퓨터는 'AI 개발 시 약 80% 수준의 공용 컴포넌트를 서비스 형태로 제공한다'고 설명한다. 이게 어떤 의미인가?
-- 기업이 AI를 성공적으로 도입시키기 위해서는 각각의 산업 도메인 별로 특정 지식과 데이터를 기반으로 엣지 케이스(Edge-case)를 해결하는 게 핵심이다. 해당 엣지 케이스를 학습해야만 비로소 활용할 수 있는 AI가 되는데, 이 부분이 실제의 20%를 차지한다. 나머지 80%는 이 엣지 케이스를 위한 사전 작업인 셈이다.
커먼컴퓨터는 이 80%에 해당하는 베이스 모델, 데이터, 컴퓨팅 자원을 공유될 수 있는 영역으로 보고, 이를 공용 컴포넌트로서 서비스 형태로 제공하는 것이다. 이를 통해 AI 도입을 원하는 기업이나 개인은 20%에 해당하는 AI 엣지 케이스의 문제해결에만 집중할 수 있다.
** 엣지 케이스(Edge-case)란? AI 알고리즘이 처리하는 데이터의 값이 알고리즘의 특성에 따른 일정한 범위를 넘을 경우에 발생하는 문제를 말한다.
Q. 80%에 해당하는 공용 컴포넌트에 대해 더 자세히 설명해달라. 무엇을 공유한다는 뜻인지?
-- 인력, 비용, 시간을 모두 포함한다. 예를 들어, 알파고 AI는 수퍼컴퓨터 수 백 대가 필요하기 때문에 구글이 아니면 운용할 수 없다. 국내에서도 네이버, 카카오가 아니라면 대형 AI를 돌리기 힘들다. 모 기업은 하나에 3억원에 달하는 AI용 NVIDIA DGX A100를 100대 구입하기도 했다. 그 정도되어야 AI 베이스모델을 돌릴 수 있다.
장비뿐만이 아니다. AI모델은 코드이니 오픈소스에 있으니까 가져다 쓸 수 있다고 해도, 그걸 실행하기 위한 실행 환경은 갖추기 어렵다. 만약 클라우드로 구축한다면 전문가가 필요하다. 데이터 입력 과정에서도 기업에 데이터 전문가도 있어야 한다. AI 개발을 위한 일련의 과정을 모두 포함한다.
Q. 활용 사례가 있다면, 설명해달라.
-- 커먼컴퓨터는 AI 모델 개발에 필요한 실행 환경과 컴퓨팅 자원이 결합된 공통 모듈을 제공한다. AI 모델 코드를 가지고 있다면, 빠르게 테스트해 볼 수 있도록 80%의 완성도를 가진 AI를 제공하는 것이다.
현재 협업 중인 LG 그룹 사례를 예로 들면, LG는 18개 계열사가 있는데 각각 AI 연구를 하고 있었다. 그 중에는 중복되는 공통 작업도 있었고, 더불어 개별적으로 개발된 AI를 함께 공유해 활용하고자 하는 니즈도 있었다. 그래서 LG는 공통 모듈이나 다양한 AI를 간편하게 공유할 수 있는 허브를 만들고자 했고, 마침 우리 커먼컴퓨터가 솔루션을 제공할 수 있었다.
스타트업에서도 연락주신다. 어떤 분은 국내 IT 선도 기업에서 일하다가 창업을 위해 나왔는데, 모든 개발 자원을 스스로 만들어야 하는 상황에 부딪혔다. 기업 안에서는 모든 자원이 있었지만, 외부에서는 처음부터 직접 갖춰야 하는 어려움이 크다.
Q. 어떻게 실현할 수 있었는지 궁금하다.
-- 80%의 수준을 제공하려면 해당 컴퓨팅 자원을 커버할 수 있는 멀티클라우드와 AI 모델을 운영할 수 있는 플랫폼이 필요하다. 하지만 커먼컴퓨터가 직접 자원을 투자하고, 데이터를 수집하는 매니지드 방식으로 할 수 없다.
커먼컴퓨터는 블록체인 활용 분산 네트워크 프로토콜 기반의 공유 방식의 'AI 네트워크'로 해결했다. 블록체인으로 배포되게 되면, 계약에 의해 프로그램이 관리 되기 때문에 손쉽게 다양한 AI 공용 컴포넌트들을 연결시킬 수 있다.
Q. 블록체인을 활용하는 방식에 대해 자세히 설명해달라.
-- 만약 사용자가 AI 모델을 돌리기 위해 자원을 이용한다면 기본적으로 신뢰가 필요하다. 만약 블록체인으로 기록된다면 스마트 컨트랙트, 즉 계약을 통해 해결할 수 있다. 그래서 블록체인을 활용한 것이다.
그리고 자체적으로 블록체인을 개발한 이유 역시 따로 있다. 기존의 비트코인이나 이더리움은 금융 거래를 위해 만들어진 블록체인이기 때문에 모든 거래가 장부에 기록되어야 했다. 그러다 보니 느릴 수 밖에 없다.
하지만 저희는 AI 연산에 속도도 굉장히 중요한 요소다. 그래서 멀티 체인 방식으로 개발해, 중요한 계약 정보는 온체인으로 장부에 기록하되, 실제 작업이 일어나는 과정은 오프-체인으로 장부에 기록하지 않고 속도를 증가 시켰다. 꼭 기록해야할 정보만 온-체인으로 올리고, 계약 조건에 따라 AI 작업 자체의 신뢰가 중요하다면 온-체인에 기록할 수 있도록 바꿀 수 있으며, 현재 공식적으로 5000TPS의 속도를 인증 받았고, 앞으로도 지속적으로 향상시킬 계획이다.
최근 DSRV와 라인 블록체인이 AI네크워크의 블록체인 워커로 참여해 저희 기술력을 인정 받은 계기가 됐다.
Q. 그렇다면 어떻게 비즈니스로 만들 수 있나?
-- 지난 2년은 블록체인 기반의 'AI 네트워크'가 기술적으로 실현 가능한 지 증명하는 기간이었고, 성공했다고 본다. 이제 'AI 네트워크'가 활용된 AI 공용 컴포넌트 간편 활용 플랫폼인 '아이나이즈(Ainize)'로 구축해 컴퓨팅 자원 제공자, AI모델과 개발자, 그리고 사용자로 구성된 생태계를 만들고 있다.
이 '아이나이즈' 플랫폼을 통해 AI 도입을 원하는 기업이나 개인 사용자는 AI 모델을 골라 곧바로 컴퓨팅 자원과 연결해 빠르게 AI를 개발할 수 있다. 이 과정에서 개발된 AI를 통해 이익이 발생한다면 블록체인을 통해 자연스럽게 계약된 AI 모델 개발자와 컴퓨팅 자원 제공자와의 이익 공유도 가능하다.
Q. 스타트업이 생태계를 구축한다는 점에서 어려운 점이 많을 것 같다.
-- AI 개발을 원하는 사용자가 많아야 AI 모델 요청이 많아지고, 덩달아 자원을 제공할 수 있기 때문에, 각각 3박자가 딱 맞아야 한다. 최근 AI 개발 환경이 중요해지면, 여러 컴퓨팅 자원 제공 기업이 GPU 서버를 늘리고 있지만, 실제 가동률은 50% 미만이다. 이런 유휴 자원을 AI네트워크로 충분히 활용할 수 있다. 그리고 점점 AI 개발에 대한 시장의 니즈도 점점 늘어가고 있다고 판단한다.
다만, 개발자들은 이익만을 보고 움직이지 않기 때문에 '아이나이즈'를 깃허브처럼 AI모델을 자유롭게 공유하고 의견을 나눌 수 있는 곳으로 만들고자 한다. 코로나 팬데믹 이전에는 홍보를 위해 해외 해커톤 등 여러 행사로 알렸지만, 지금은 알릴 수 없어 현재로선 가장 어려운 부분이다.하지만 깃허브가 개발 문화를 바꾼 것처럼, 우리도 AI 개발 문화 자체를 바꾸는 것이기 때문에 천천히 시장의 때를 기다리고 있다.
" 인공지능 시대에 맞추어 자연스럽게 형성되고 있는 유휴 컴퓨팅 자원의 공유 경제 시장에서, 커먼컴퓨터의 기술이 주도적인 역할을 할 것"
- KB인베스트먼트의 이지애 이사
Q. 그렇다면 지금의 커먼컴퓨터는 어떻게 유지되고 있는지?
-- 우선 2019년에 30억 원 규모의 시리즈 A 투자를 받았고, 실제 비즈니스 영역에서 커먼컴퓨터의 솔루션을 필요로 하는 사례들을 다양하게 확인해왔으며, 비즈니스로 연계하여 지속적으로 레퍼런스를 쌓고 있다.
이외에도 모두의연구소나 부경대에 개발자와 교육생을 위해 AI 실습 환경을 웹기반으로 자원과 실행 환경을 제공하는 워크 스페이스 서비스를 제공하고 있으며, AI 바우처 사업 등 여러 정부지원사업에도 선정됐다.
Q. 마지막으로 향후 장 · 단기 목표를 말해준다면?
-- 우선 단기적으로는, 사용자가 쉽게 자연어 처리 AI를 개발할 수 있는 Teachable NLP와 같은 간편한 MLOps 솔루션을 아이나이즈에서 제공하고 있는데, 언어 이외에도 이미지, 음성 데이터로도 확장할 예정이다.
장기적으로는 3년 내에 지금 커먼컴퓨터의 10배 성장하는 것으로, 매출 100억원 이상, 글로벌 아이나이즈 사용자를 10,000명 이상으로 늘리는 게 목표다. 최종은 AI 개발의 깃허브가 되는 것이다.
댓글을 달기 위해서는 로그인해야합니다.
[…] 방수용 커먼컴퓨터 COO (인터뷰 읽기) […]