최근 오픈AI의 인공지능(AI)인 ‘챗GPT’ 기반 ‘빙’으로 구글 검색에 반격을 시작한 마이크로소프트(MS)가 또다시 일을 낼 모양이다. MS가 그래픽칩(GPU)의 양대산맥 중 하나인 AMD와 손잡고 강력한 AI칩을 개발중이라는 소식이 알려지면서 업계의 이목을 집중시키고 있다.
지난해 11월 본격 시작된 AI시대를 맞아 급속히 존재감을 높여 온 MS는 현재 (느슨한)협력관계인 엔비디아를 통해 AI용 그래픽칩(GPU)를 공급받고 있다.
이런 상황에서 MS가 내년에 엔비디아보다 더 강력한 자체 AI칩을 내놓을 것이라는 소식이 나온 것이다. 초기 AI시장 서비스 주도에 이어 그 품질을 좌지우지할 최고급 AI 칩까지 내놓겠다는 것이다. 칩 시장지배자의 공급가에 좌지우지되지 않고 값싸게 고객서비스를 하겠다는 의미로 읽힌다. 이 점은 이미 AI가속기를 가지고 있는 구글에게서도 읽힌다.
MS가 AMD가 손잡고 비밀리에 개발 중인 AI칩에 대한 일부 내용이 아티피셜코너, 블룸버그, 디인포메이션 등을 통해 새 나왔다. MS는 부인하고 있지만 지난 2019년부터 개발을 시작해 온 것으로 알려진 MS의 AI칩 ‘아테나’ 개발 및 AMD와의 비밀 동맹은 기정사실로 굳어지고 있다. MS의 AI칩 개발 배경과 상황 및 전망을 살펴봤다.
MS와 AMD의 비밀동맹
MS와 AMD 간 비밀동맹의 배경은 무엇보다도 엔비디아의 AI용 그래픽칩(GPU) 시장 지배에 맞서기 위한 것이라는 해석이 나온다.
세계적 AI열풍이 불고 있다고는 하지만 아직까지 초기 상태인 AI업계는 점점더 많은 AI칩을 필요로 하는 상황이다.
그리고 현재 세계 AI칩의 90%내외를 공급하는 것으로 알려진 엔비디아의 GPU는 엄청나게 비싸다.
일례로 현재 MS가 챗GPT용으로 사용하는 애저 클라우드센터 플랫폼에는 개당 최소한 2만달러(2650만원)이나 하는 엔비디아 A100 GPU가 수만개나 사용되고 있다. 게다가 가격도 오르고 있다. A100보다 더 강력한 엔비디아 H100 GPU 가격은 지난해 3만6000달러(약 4800만원)였지만 올들어 4개월 만에 4만56000달러(6000만여원)까지 치솟았다. 이는 AI업계의 비용과 서비스요금을 높이는 요인이 된다. 지난 5일 비즈니스인사이더는 오픈AI가 지난해 5억4000만달러의 순손실(추정치)을 기록했다고 보도했다. 더 앞선 AI서비스를 위해 비싼 고성능칩을 더많이 사용해야 하는 AI업계로선 부담스러울 수 밖에 없다.
게다가 일단 한발 늦은 구글조차도 자신들의 텐서칩(TPUv4)이 엔비디아 칩보다 빠르다고 주장하며 AI시대의 강력한 경쟁자로 참여하고 있다.
이런 상황을 맞은 MS에 AMD는 CPU와 함께 줄곧 컴퓨터게임용 그래픽칩(GPU)을 개발해 온 인텔보다 경험많고 유능한 칩 개발업체다. CPU가 주력인 인텔과 달리 AI칩 개발 동맹자가 되기에 충분하다. AI 칩은 AI 알고리즘의 성능을 가속화하는 특수 프로세서로서 기존 CPU 및 GPU보다 훨씬 빠르며 대형 언어 모델을 교육하고 배포할 수 있다.
MS가 개발중이라는 자체 AI가속기인 ‘아테나’는
앞서 언급한 것처럼 최근 폭발적으로 증가하고 있는 AI 제품들이 나올 수 있게 한 AI용 하드웨어는 대부분이 엔비디아의 칩이다. 이는 부분적으로 소비자 및 워크스테이션용 GPU시장에서의 지배적인 위치와 잘 확립된 쿠다(CUDA, GPU 프로그래밍 언어) 라이브러리 및 AI 가속 텐서 코어 덕분이다.
MS가 자사 애저 클라우드 데이터 센터에서 수만 개의 엔비디아 GPU를 사용하지만, AMD와도 협력해 자사 GPU의 AI 기능을 개선하고 있다고 보도한 것은 블룸버그다. 이 매체는 지난 5일 부분적 사항만 드러났다면서 “MS가 AI 워크로드에서 자사 제품의 성능을 향상시키기 위해 AMD를 지원하고 엔지니어링 리소스를 제공하고 있다”고 보도했다. 이에 따르면 AMD는 MS가 개발한 AI 가속기인 ‘아테나(Athena)’에 공을 들이고 있다.
앞서 지난달 18일 디인포메이션이 MS가 최소한 2019년초부터 아테나란 이름의 AI칩을 만들고 있다고 보도했는데 이를 재확인한 것이다. (AI 가속기란 이름 그대로 AI를 구현하고 실행하기 위한 전용 하드웨어다. AI등장 초기에는 CPU, GPU, 메모리 등 범용 컴퓨터 부품을 이용해 AI를 구현했으나 점점 AI만을 위한 독자적 HW필요성이 제기되면서 관련 연구도 활발해졌다.)
그러나 MS 대변인은 AMD가 아테나의 개발에 관여했다는 사실을 단호히 부인했다.
하지만 구글의 부인에도 아티피셜 코너는 7일 “아테나는 2024년에 상용화될 것으로 예상되며, 300명의 MS 엔지니어 팀이 5나노미터 공정을 사용해 개발하고 있으며, 현재 엔비디아의 AI 칩보다 더 효율적이고 강력하게 만들어지고 있다”고 구체적 개발 내용을 보도했다.
MS의 아테나칩 기대효과는
MS는 일단 오픈AI와 손잡고 초기 AI서비스에서 선두로 치고 나오는데 성공했고, 점점 더 많은 제품에 AI 기능을 내장하려고 하고 있다.
따라서 내년에 ‘아테나’가 예정대로 나온다면 AI 가속기 하드웨어 구매를 위한 더욱 치열하게 경쟁하게 될 시장에서 서버 비용을 절약하게 된다. 그리고 이는 고객들에게 더 싸게 AI 서비스를 제공하는 원동력이 될 수 있다.
디인포메이션은 지난달 예를 들어 MS는 기업들에게 챗GPT의 프라이빗 버전을 제공하기 위해 개발작업 중인 것으로 알려지고 있는데 가격은 일반 챗GPT 버전보다 10배나 더 비쌀 수 있어 이를 낮출 필요가 있다고 보도했다. 즉, 이러한 생성 AI 모델을 실행하는 데 필요한 서버 하드웨어가 더 저렴해진다면 MS는 이러한 제품을 더 매력적으로 만들어 줄 AI 서비스 가격, 비용, 또는 두 가지 모두를 갖게 될 것이다.
MS와 AMD 협력, 이번이 처음 아니다
사실 MS와 AMD는 이미 이전에도 일종의 협업 관계를 맺고 일해 왔다.
‘서피스 에디션’ 라이젠 프로세서는 최신 서피스 기기에서는 아니지만 일부 구사양 MS 서피스 PC 버전에 사용돼 왔다.
AMD의 서피스 에디션 라이젠 프로세서와 일반 라이젠 프로세서는 크게 다르지 않았다.
MS 서피스 에디션 라이젠 프로세서는 AMD가 다른 제조업체에 판매하는 칩과 동일하다. 다만 MS 지원을 받아 펌웨어, 드라이버 및 소프웨어 스택을 최적화했다.
이는 MS 아테나에 AMD 기술이 어떻게 녹아 들어갈지 가늠케 해 준다.
AMD는 과연 엔비디아에 대적할 흡족한 기술 성능을 갖추고 있나?
올초 이뤄진 각 회사의 서버급 GPU 테스트는 이들의 성능을 대표하지는 않지만 AMD의 GPU 아키텍처가 AI 워크로드에 어느 정도 대응하는지 들여다 볼 수 있게 해 준다.
톰스 하드웨어가 올해 1월 말 스테이블 디퓨전 이미지 생성기를 사용해 테스트한 결과 AMD의 기존 라데온 RX 7900 XTX 주력칩 성능은 대부분의 게임에서 엔비디아의 RTX 4080보다 앞섰지만 엔비디아 RTX 4090, 4080, 4070 Ti보다는 뒤졌다.
엔트리 레벨 엔비디아 RTX 3050도 AMD의 이전 세대 RX 6000 시리즈 카드를 모두 제쳤다.
그런만큼 MS가 AMD 소프트웨어를 최적화하면 이러한 GPU 카드의 성능을 향상시키는 데 도움이 될 수 있을 것이다. 하지만 AMD칩 SW가 디폴트로 엔비디아에 최적화돼 있다는 점은 눈여겨 볼 점이다.
과연 누가 AI발전의 핵심인 더 나은 칩 시장에서 주도권을 쥐게 될지 그 첫 실마리가 내년 MS 아테나 칩 등장으로 판가름나게 될 것으로 보인다.
더나은 AI칩은 더나은 대형 언어 모델(LLM)로 이어질 것이고 이를 가진 업체가 결국 AI시장을 지배할 것이기 때문이다.
과연 MS는 내년에 AI서비스 선두자리를 유지하면서 엔비디아의 H100이나 구글 TPU4보다 뛰어난 AI칩을 만들고 비용까지 절감하는 세 마리 토끼를 잡을 수 있을까.
소셜댓글