뉴로모픽, 대체 이게 뭐야?

엔비디아의 GPU를 능가할 수 있다는 뉴로모픽(neuromorphic)

뉴로모픽(neuromorphic chip), 이게 그렇게 '대세'라고 하는데 대체 무엇? 그래도 인공지능이 테크놀로지의 중심이라면 대충이라도 알아야 할 것 같아서 이렇게라도 끄적거려 본다. 어제오늘 뉴스에서 뉴로모픽에 대한 이야기가 수차례 언급되었다. 심지어 '엔비디아를 능가하게 될 것'이라는 이야기까지 있었다. 엔비디아(Nvidia)라고 하면 AI 반도체 시장에서도 가장 독보적인 기업이 아니던가. 오픈 AI도 챗GPT에 엔비디아 A100 반도체를 사용하고 있는데 참고로 GPT-4에는 엔비디아 A100 반도체 1만개로 구매 비용만 무려 1천300억 원 규모라고 전해진 바 있다. 

자, 여기서 뉴로모픽을 아주아주 간단히 말하면 인간의 뇌신경을 모방한 차세대 AI 반도체를 말한다. '상보형-트랜스포머(Complementary-Transformer)'라고도 불린다. 현존하는 AI 반도체가 저장기능도 하고 연산기능도 수행하는데 뉴로모픽은 하나의 반도체가 저장도 하고 연산도 하고 인식도 하며 패턴 분석까지 수행할 수 있다고 한다. 작년 여름 가평 어딘가에서 물놀이를 했던 기억이 있다면 사람은 이를 잔상으로 기억하고 처리한다는데 뉴로모픽도 사람처럼 이러한 방식으로 데이터를 저장할 수 있다는 것이다. 위에서 언급한 패턴 분석이라고 한다면 이미지나 오디오 등 비정형화된 데이터를 인식하고 처리하는 능력도 갖출 수 있게 된다. 인간의 뇌신경을 반도체로 구현한 시스템인지라 클라우드를 거치지 않고도 LLM을 처리할 수 있다고 한다. 그러니까 이게 어떻게 가능한 거지? 사실 구조 자체가 사람의 뇌를 닮았다는 셈인데 인간의 뇌를 모방한 개념, 그러니까 인간이라면 가지고 있는 뉴런과 뉴런 사이의 시냅스라는 연결고리를 뉴로모픽도 갖게 되는 것이다. AI 반도체에 들어가는 트랜지스터나 셀이 아닌 시냅스 형태로 구성한다는 것. 그런데 뉴로모픽의 수행 능력뿐 아니라 크기 자체가 가로 세로 1cm도 되지 않을 만큼 작기도 하고 LLM을 0.4초 만에(언어 번역은 0.2초 만에) 처리할 수 있으며 전력 소모량 자체도 기존 반도체 대비 1억 분의 1에 불과하게 되니(엔비디아 A100 GPU 대비 625분의 1이라고 한다) 반도체 시장의 핵심 기술이라는 것. 이렇게 되면 기존 엔비디아를 충분히 능가할 수 있는 얘기다. 알다시피 엔비디아의 GPU는 AI 반도체 시장 속에서 독주 체제인데 이러한 GPU에 이어 신경망 처리 장치라고 불리는 NPU(Neural Processing Unit)와 지능형 반도체인 PIM(Processor-In-Memory)으로 이어지는 구도 속에서 뉴로모픽의 등장은 반도체 시장을 장악할 만큼 놀라운 능력을 갖추고 있는 것이다. 

인간의 뇌를 닮은 뉴로모픽의 등장.  출처 : Synthedia

구글의 경우 고양이를 다른 동물 사진과 구별할 수 있는 인공지능을 개발하는데 무려 1만 6천 개에 달하는 CPU가 필요했다고 한다. 전문가들은 말한다. 미래의 컴퓨팅은 결국 사람의 뇌신경을 따라갈 수밖에 없고 대용량 저장은 물론 연산과 네트워크 기능이 결합된 칩이 등장하게 될 것이라고. 뉴로모픽이 개발된다고 하면 손톱보다 더 작은 칩 하나로도 같은 기능을 구현할 수 있다고 보면 된다. 

인간이 스트레스를 받을 때에는 여러 이유가 있을 테지만 생각할 거리가 많을 때 에너지 소모가 많아진다. 이것도 해야 하고 저것도 해야 하고 처리할게 많으니 생각을 한다는 것만으로도 체력이 소모되고 자연스럽게 스트레스도 생기게 되는 법. 반대로 생각할 것이 적으면 에너지 소모 자체가 급격하게 줄어들지 않겠는가. 뉴로모픽도 인간의 뇌를 그대로 모방하는데 입력된 값이 크면 전력 소모가 자연스럽게 커지고 크기가 작으면 전력 소모 자체도 줄어들게 된다. 이렇게 입력 데이터 크기에 따라 심층 인공 신경망 그리고 스파이킹 뉴럴 네트워크를 혼합해 사용하고 서로 다른 신경망에 할당하므로 전력 자체를 최소화할 수 있는 것이다. 

※ 심층 인공 신경망(DNN, Deep Neural Network)은 이미지 인식과 비디오 분석, 이미지 필터링 등 비전 데이터 처리에 사용되는 딥러닝 모델로 여러 인공 신경망 계층을 통해 이미지 특징을 추출, 분류, 인식하는데 활용될 수 있다고 함. 스파이킹 뉴럴 네트워크(SNN, Spiking Neural Network)는 뉴로모픽 컴퓨팅(Neuromorphic Computing, 인간의 두뇌와 신경계의 시스템을 모델로 삼는 컴퓨터 공학의 한 방법이고 뉴로모픽 엔지니어링이라고도 함)의 한 가지 형태인데 뇌의 뉴런이 스파이크라는 시간에 따른 신호를 활용해 정보를 처리하는 방식을 뜻하며 인간의 뇌 즉 생물학적의 '뇌'가 작동하는 방식에 가까워 에너지 효율 자체가 높고 실시간 처리와 복잡한 데이터 분석에 적합하다고 알려져 있음. 뉴로모픽 구조는 뉴런과 시냅스를 모델로 하는 경우가 가장 많은 편이라고 함. 

생성형 인공지능의 등장, 온디바이스 AI 등 이제 세상은 '모든 것을 위한 AI(AI For Everything)'로 거듭나고 있다. AI 반도체의 수요와 성능 요구는 어쩌면 당연한 것이다. 연구진들 또한 급변하는 시장 요구에 부응하기 위한 차세대 AI 반도체 솔루션 개발을 꾀하고 있고 이번 뉴로모픽의 연구 결과가 제대로 상용화될 수 있도록 문제가 되는 부분들을 짚어보겠다고 언급했다. 생각해 보면 뉴로모픽 연구는 매우 가치가 있는 것이지만 결국엔 상용화 과정에서 생길 수 있는 다양한 이슈들이 중요한 관건이기도 하다. 또한 언어모델에만 제한적으로 활용되는 것이 아니라 다양한 분야에 적용될 수 있어야 할 것이다.


본 기사의 원문은 여기서 볼 수 있습니다.

pen잡은루이스

tech42@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

다이소에서 만 원짜리를 팔게 된다면

유통업계가 소문 만으로도 긴장하는 데는 다 이유가 있습니다 모두가 긴장했을 겁니다 직장인 익명 커뮤니티 블라인드에 "다이소 가격대가 1만 원까지 확대될...

비전프로 국내 출시에 앞서... (지난 반년의 경험, 그리고 비전 OS 2의 가능성)

애플의 증강현실(AR) 헤드셋 ‘비전 프로’가 11월 15일 드디어 국내 시장에 출시됩니다. 비전 프로는 지난 2월 미국에서 첫 출시된 이후 주요...

디지털 아트의 딜레마, 즐거움과 깊이 사이

몰입형 미디어 아트 전시의 가능성과 한계 디지털 아트의 전시는 몰입형 미디어 아트 전시장에서 화려한 시각 효과와 감각적 체험을 통해 관람객에게...

페이스북과 구글 뉴스 우선순위 하락에 대응하는 BBC와 The Hill의 트래픽 전략[2024년 버전]

페이스북과 구글 뉴스 우선순위 하락에 대응하는 BBC와 The Hill의 트래픽 전략에 대해 정리했습니다. 영미권 언론사들은 페이스북과 구글 등 주요 플랫폼이...