한국전자통신연구원이 고성능 AI 반도체 칩을 활용해 낮은 전력으로 초당 약 5천조 회 연산이 가능한 인공지능 시스템을 개발했다고 2일 밝혔다.
자율주행, 사람·사물·음성 인식, 데이터센터 등 AI 응용서비스가 고도화됨에 따라 인공지능의 학습과 추론을 위해 거대한 양의 연산을 빠르게 해내는 고성능 서버의 필요성이 높아지고 있다. 하지만 기존 컴퓨터와 모바일에서 주로 활용된 중앙처리장치(CPU, AP)는 단순 계산에 최적화돼 있다는 한계가 있다. 이에 그래픽스처리장치(GPU)가 널리 활용되고 있으나 구조적으로 인공지능 연산 처리에 최적화되어 있지 않아 데이터 지연 및 전력 낭비가 발생한다. 신경망처리장치(NPU) 기반 AI 반도체가 차세대 AI 두뇌로 떠오르는 이유다.
ETRI는 작년 NPU 기반 AI 반도체 칩 'AB9(알데바란9)'을 공개한 데 이어 올해 AB9 기반 보드와 인공지능 시스템을 개발하는 데 성공했다. 자율주행차, 클라우드, 데이터센터, 사람·사물·음성 인식 등 AI 응용 서비스를 제공하는 고성능 서버에 본격적으로 활용하기 위해서다.
현재 AI 알고리즘 처리 가속기로 많이 활용되는 GPU 보드는 부피가 커서 1개 서버 노드에 6~7대밖에 장착할 수 없고 전력 소모도 높다. 반면 AB9가 내장된 NPU 보드는 한 서버 노드에 최대 20개씩 장착 가능하다. 기존 시스템 대비 공간·전력효율을 개선하면서 가격도 낮췄다. 이를 바탕으로 서버 노드 8개를 쌓아 AI 시스템 아트브레인을 만들었다.
서버 1개당 1초에 약 5천조 회 연산이 가능한 셈이다. 기존 GPU 기반 인공지능 서버 대비 약 4배의 연산 성능과 7배의 전력효율이다.
이 밖에도 ETRI는 AI 알고리즘을 쉽게 개발할 수 있도록 SW 개발환경도구 ‘AIwareRT’를 깃허브(Github)에 공개했다. 프로그래밍에 필요한 기본적인 구조와 알고리즘, 시뮬레이터, 최적화 도구 등을 라이브러리 형태로 제공해 프로그래밍 언어에 생소한 사람들도 쉽게 사용해볼 수 있게 구성했다.
한진호 ETRI 인공지능프로세서연구실장은 “이 기술이 데이터센터 등에 적용되면 처리 용량과 속도가 대폭 개선될 전망”이라고 말했다.
소셜댓글