인공지능(AI)에 의해 구동되는 ‘챗GPT’같은 혁신적 채팅 AI 서비스 모델이 최근 IT업계는 물론 전세계 기업과 사용자들을 강타하고 있다. 챗GPT는 그 뛰어난 성과로 인터넷과 스마트폰에 이어 ‘AI혁명’ 시대를 예고하고 있다. 이에 자극받은 마이크로소프트(MS)와 구글 같은 회사는 이같은 AI 기능을 검색엔진에 통합하기 위한 기술 및 투자 경쟁을 벌이고 있다. 특히 두 회사의 경우 이 시장을 빼앗느냐 유지하느냐가 기업 핵심사업의 흥망과 직접 연결된 문제가 된다. 지난해 말부터 최근까지 이어지고 있는 ‘생성 AI’ 열풍은 멀리는 1990년대 인터넷, 가까이는 지난 2007년 애플의 아이폰 등장 이후 십수년 만에 보는 기술 혁신이다. 전 산업계가 AI기술 혁명에 열광하고 있지만 IT업계에서 가장 큰 힘을 받는 회사로 엔비디아를 빼놓을 수 없다. 엔비디아는 AI 개발에 필수적인 개당 1만달러(약 1300만원)나 되는 그래픽칩(GPU)은 물론 소프트웨어(SW)와 알고리즘 기술을 가진 AI혁명의 가장 중요한 동력 공급처로 떠올랐다. 게다가 AI용 컴퓨팅 파워가 필요한 회사들을 대상으로 한 AIaaS(AI as a Service)까지 제공하기 시작했다. AI 시대의 동력이 왜 GPU 기술회사인 엔비디아에서 나오게 됐는지, 이 회사가 어떻게 AI 생태계를 좌지우지하게 됐는지, 그리고 이 ‘AI시대의 총아’의 향배를 3회에 걸쳐 점검해 본다. CNBC, 벤처비트, IE, 넥스트 플랫폼을 참고했다.
②‘GPU+범용 연산기술’, AI 생태계 지배
GPU+범용연산기술(CUDA)로 ‘딥러닝 혁명’→결국 AI혁명으로
엔비디아가 아이폰 이후 최대의 혁명으로 여겨지는 AI혁명의 중심 기업이 된 것은 AI훈련 및 성과를 위한 최적의 연산칩인 GPU에서 앞서 있기 때문이다. 하지만 그에 머물지 않고 지난 10여년 간 자사 GPU칩 기반의 AI 응용 SW와 시스템을 포함하는 생태계를 구축했다. 이는 향후 상당 기간 동안 엔비디아가 이 시장에서 주도권을 잃지 않게 될 것임을 시사한다. 그렇게 되기까지 신경망 훈련용 GPU 공급을 통한 과정에서 얻은 AI시대에 대한 통찰력과 관련 투자를 통해 자체 생태계를 구축한 것이 큰 역할을 하고 있다.
물론 이견이 없는 것도 아니다. 지난 2016년 포브스 인터뷰에 따르면 젠슨 황 엔비디아 CEO는 항상 그래픽 칩이 최신 비디오 게임에 대한 역할을 하는 것을 넘어서는 잠재력을 갖고 있다는 것을 알고 있었지만, 딥러닝으로의 전환을 예상하지는 못했다.
사라 후커는 2020년 젠슨황의 다양한 HW툴의 성공과 실패를 탐구한 에세이 ‘하드웨어 복권(*The Hardware Lottery)’에서 사실 엔비디아의 심층 신경망용 GPU의 성공은 “기상천외한 행운의 우연”이었다고 말했다.(* https://hardwarelottery.github.io/)
그녀는 지난해 벤처비트와의 인터뷰에서 엔비디아의 성공은 “복권에 당첨된 것과 같다”며 “대부분은 HW 측면의 진전과 모델링 측면의 진전 사이의 적절한 시간에 정렬해 있었던 덕분이었다. 그 변화는 거의 즉각적이었다”고 말했다. 그는 “1만3000개의 CPU가 필요했던 것이 하룻밤 새 단두 개의 GPU로 바뀌었다. 극적이었다”고 말했다.
반면 엔비디아는 그 평가에 동의하지 않는다. 회사는 엔비디아가 AI가 가장 중요한 시장이 될 줄 몰랐음에도 2000년대 중반부터 GPU가 신경망을 가속화할 수 있는 잠재력을 알고 있었다는 입장을 고수하고 있다.
엔비디아 대변인은 “우리는 세계에서 가장 중요한 문제가 가속화된 컴퓨팅을 필요로 한다는 것을 알고 있었다. 그래서 우리는 쿠다(CUDA·Compute Unified Device Architecture)를 맨위에서 맨아래에 이르기까지 구축하는 데 많은 투자를 했고, 수백만 명의 개발자들에게 범용 가속화를 할 수 있도록 했다. 엔비디아가 만드는 모든 GPU에 쿠다를 추가하는 것은 엄청난 일이었다”고 밝혔다. (쿠다는 GPU에서 수행하는 (병렬 처리) 알고리즘을 C 프로그래밍 언어를 비롯한 산업 표준 언어를 사용해 작성할 수 있게 해 주는 GPU 상의 범용계산용 기술(GPGPU)이다. 즉, GPU 상에서 CPU의 응용 계산까지 처리해 준다. 이 아키텍처를 사용하려면 엔비디아 GPU와 특별한 스트림 처리 드라이버가 필요하다. 쿠다는 G8X GPU로 구성된 지포스 8 시리즈급 이상에서 동작한다.)
엔비디아가 지난 2007년 추가한 쿠다 컴퓨팅 플랫폼은 SW와 미들웨어 스택이다. 이는 연구자들이 GPU가 할 수 있는 컴퓨팅 파워와 극한의 병렬처리를 프로그래밍하고 접근할 수 있도록 해 준다. 엔비디아 안팎의 전문가들은 엔비디아가 2007년에 GPU에 쿠다를 추가하지 않았다면 딥러닝 혁명이 일어나지 않았을 것이라고 강조한다.
엔비디아가 쿠다를 출시하기 전까지는 GPU를 프로그래밍하는 것은 길고 힘든 코딩 과정이었고, 많은 양의 낮은 수준의 기계 코드를 작성해야 했다. 연구원들은 무료였던 쿠다를 사용해 훨씬 더 빠르고 저렴하게 딥 러닝 모델을 개발할 수 있었다. 물론 엔비디아의 HW(GPU)에서였다.
젠슨 황은 지난해 3월 스트레처리의 벤 톰슨과 가진 인터뷰에서 “쿠다는 GPU를 접근성있게 만들어줬고, 우리는 모든 세대의 프로세서와 쿠다 간 호환성을 유지하기 위해 헌신했기 때문에 새로운 프로그래밍 모델을 발명했다”고 말했다
알렉스넷으로부터 시작된 AI시대의 가능성
하지만 쿠다가 출시된 지 6년이 지난 후에도 엔비디아는 여전히 AI에 올인하지 않았다.
브라이언 카탄자로 엔비디아 응용 딥러닝 연구 부사장은 알렉스넷(AlexNet)이 발표되고 다른 연구자들이 GPU를 만지작거리고 있을 때 자신을 제외하고는 “엔비디아에서 AI를 연구하는 사람이 정말 없었다”고 말했다. (알렉스넷은 1989년 지오프리 힌튼 토론토대 교수의 제자였던 얀 르쿤이 개발한 8개의 층으로 이루어진 합성곱 신경망(CNN) 기반 아키텍처다. 2012년 힌튼 교수팀은 알렉스넷으로 이미지넷대회(ILSVRC·ImageNet Large Scale Visual Recognition Challenge)에서 우승하면서 컴퓨터 비전 딥러닝 분야의 기술적 전환점을 가져온다. 이미지넷 대회는 이미지로 된 데이터베이스 내의 1000개 카테고리에 있는 120만 장의 이미지로 학습하고, 무작위로 주어진 10만 장의 이미지를 가장 정확히 분류해 내는 지 경합하는 대회다.)
당시 카탄자로는 스탠포드대의 AI 거장 앤드류 응과 함께 “구글의 1000대의 서버를 자신의 팀이 프로그래밍한 쿠다 커널과 GPU를 사용한 3대의 서버로 교체하는 소규모 프로젝트를 진행하고 있었다”고 설명했다. 그는 또한 그 기간 동안 뉴욕대 AI 연구소의 얀 르쿤(현 메타의 AI 연구 책임자), 롭 퍼거스(현 딥마인드 연구 과학자)와 얘기를 나누고 있었다.
카탄자로 엔비디아 부사장은 “퍼거스는 얼마나 많은 기계 학습 연구자들이 GPU용 커널을 프로그래밍하는 데 시간을 할애하고 있는지 놀라울 정도다. 당신은 그걸 정말 잘 봐야 한다고 말했다. 그래서 조사해 봤더니 고객들은 딥러닝을 위해 GPU를 대량으로 구매하기 시작하고 있었다. 결국 젠슨 황 CEO와 엔비디아의 다른 사람들도 주목했다”고 말했다.
엔비디아의 AI용 칩 책임자인 브라이언 카탄자로는 2014년 엔비디아를 떠나 앤드루 응과 함께 바이두에서 일하다가 2년 만인 2016년 엔비디아로 복귀해 응용 딥러닝 연구에 초점을 맞춘 새로운 연구소장을 맡았다. 당시 그가 엔비디아에서 이 분야의 유일한 멤버였지만 7년이 지난 후 그는 40명의 연구원들로 구성된 팀을 이끌게 된다.
젠슨황 2014년 이후 AI 강조...SW 중심 플랫폼 전략 전환
젠슨 황 엔비디아 CEO는 2013년 GTC 기조연설에서 AI를 거의 언급하지 않았지만 2014년까지 AI 미션에 완전히 빠져 버린다. 그의 2014년 GTC 기조연설에서 AI는 갑자기 전면 중앙에 올랐다. 그는 “기계 학습은 오늘날 고성능 컴퓨팅에서 가장 흥미로운 응용 프로그램 중 하나다. 흥미로운 돌파구, 거대한 돌파구, 마법의 돌파구를 보여준 분야 중 하나는 심층 신경망이라고 불리는 분야다”라고 강조했다.
카탄자로 엔비디아 부사장은 젠슨 황이 회사 설립자로서 “회사를 뒤집을 수 있는 권한이 있었고, 그는 그저 덤벼들었다. 그는 AI가 이 회사의 미래이며, 우리는 그것에 모든 것을 걸 것이라고 깨달았다”고 밝혔다.
2012년 이미지넷 대회에서 알렉사넷이 보여준 대전환의 순간에는 몇 명의 연구원과 GPU가 있었다. 그러나 카리 브리아스키 엔비디아 제품관리 및 AI SW 부사장에 따르면 이것은 단지 첫 번째 이정표에 불과했다.
다음 과제는 GPU의 힘을 어떻게 확장할 것인가 하는 것이었고 이를 엔비디아가 떠맡았다는 것이다.
브라이스키 엔비디아 부사장은 “우리는 GPU가 함께 통신할 수 있게 해주는 SW 작업을 했기 때문에 단일 GPU에서 다중 GPU로, 그리고 다중 노드로 전환했다”고 밝혔다.
지난 7년간 엔비디아는 라이브러리와 프레임워크에서 쿠다로 코딩해야 할 필요성을 갖게 하는 딥러닝 SW 구축에 쿠다 기술이 사용되도록 한다. 이는 쿠다 심층신경망(cuDNN)과 같은 쿠다 가속 라이브러리가 더 널리 사용되는 파이썬 기반 라이브러리인 파이토치와 텐서플로에 배치될 수 있게 한다.
브라이스키는 그 결과 “이제 고객은 신경망을 얻기 위해 서로 통신하는 수백, 수천 개의 GPU로 확장할 수 있게 됐다. 훈련 기간은 몇 달에서 몇 주로 줄었다. 오늘날 동일한 신경망을 훈련하는 데는 몇 초밖에 안 걸린다”고 말했다.
또한 2018년에 이르자 GPU는 AI 훈련뿐만 아니라 음성 인식, 자연어 처리, 추천 시스템 및 이미지 인식 기능을 지원하기 위한 추론에도 사용됐다. 이는 엔비디아의 T4 칩과 같은 더 많은 HW뿐만 아니라 데이터 센터와 자율주행차 애플리케이션, 로봇 및 드론에서 이러한 실시간 추론 워크로드를 지원할 더 많은 SW가 필요하다는 것을 의미했다.
엔비디아는 이제 SW 라이선스 회사?
다스 엔비디아 부사장은 “그 결과 엔비디아는 HW 회사라기보다는 SW회사가 되었다”고 말했다. 엔비디아는 점점 더 많은 SW엔지니어와 연구원을 고용했고 연구 부서를 AI의 최첨단이 되도록 만들었다.
그는 “우리는 이 모든 SW를 하나씩 구축하기 시작했다. 하나의 SW 사례에서 다른 SW사례로 만들어 갔다. 표준과 프레임워크가 진화하기 시작하자 엔비디아는 훈련용 텐서플로우와 파이토치처럼 이를 GPU에 최적화했다. 그는 ”우리는 AI 개발자가 됐고 생태계를 정말로 받아들였다“고 덧붙였다. (텐서플로는 구글의 검색, 음성 인식, 번역 등의 앱에 사용되는 기계 학습용 엔진으로서 파이썬 API를 제공하며 공개SW다.)
젠슨황은 엔비디아 GTC2022 분석가/투자자 컨퍼런스에서 전년도에 출시된 AI 엔터프라이즈 SW스위트에 대한 감사의 표시를 포함, 자사가 진행 중인 SW 및 플랫폼 초점을 매우 명확히 했다.
그는 “우리 SW의 중요한 점은 그것이 우리의 플랫폼 위에 구축됐다는 것이다. 이는 엔비디아의 모든 HW 칩과 시스템 플랫폼을 활성화한다는 것을 의미한다. 그리고 두 번째로 우리 SW는 산업을 정의하는 SW라는 점이다. 우리는 마침내 기업들이 라이선스를 부여받아 사용할 수 있는 제품을 생산했다. 그들은 그것을 요구해 왔다. 그들은 단지 오픈 소스로 가서 모든 것을 다운로드하고, 그것을 기업에 적용할 수는 없다. 단지 리눅스로 가서 오픈 소스 SW를 다운로드하고 그걸로 수십억 달러 규모의 회사를 운영할 뿐이다”라고 말했다.
플랫폼 접근 방식으로 강력한 생태계···경쟁력 확보
결국 엔비디아가 구축한 플랫폼 접근 방식의 결과는 고객이 엔비디아에서 구매할 때마다 SW를 구매하는 것이 아니라 엔비디아의 가치 사슬을 구매한다는 것이다.
가트너의 드케이트 연구원은 이것이 엔비디아 전략의 또 다른 핵심 요소라고 설명했다. 엔비디아가 GPU와 쿠다, 그리고 고객에게 가장 친숙한 옵션과 소싱으로 고객들을 에워싼 엔비디아의 채널 전략으로 생태계 성장 플라이휠(회전속도 조절 바퀴)을 만들었다는 것이다.
그는 “엔비디아가 기업 최종 사용자를 직접 설득할 필요는 없다. 최종 사용자는 익숙한 기술을 사용할 수 있지만 이를 조작하는 것은 여전히 엔비디아다”라고 말한다.
소셜댓글