서울대 공대 전병곤 교수팀, AI 학습 및 추론 수행 시 기존 대비 22배 빠른 님블 시스템 개발

 

서울대학교 컴퓨터공학부 전병곤 교수 연구팀이 그래픽 처리 장치(GPU)를 활용해 인공지능 학습과 추론 수행 시 기존 시스템 대비 최대 22배 빠른 님블(Nimble) 시스템을 개발했다고 30일 밝혔다.

이 시스템을 통해 응용 서비스에서 인공지능 모델을 곧바로 고속 수행하는 것이 가능해져 다양한 분야에서 인공지능 모델의 효율적 사용이 가능할 것으로 기대된다. 현재 수많은 기업과 연구소가 인공지능 계산의 편의성을 위해 파이토치(PyTorch), 텐서플로우(TensorFlow) 등의 인공지능 시스템을 사용하고 있다. 이러한 시스템들은 인공지능 학습과 추론 수행 속도 향상을 위해 GPU를 이용한다. GPU에 연산 수행을 요청하기 전에는 이를 위한 준비를 하는 스케줄링(scheduling) 과정을 매번 진행한다.

전병곤 교수 연구팀은 현 인공지능 시스템들이 스케줄링 과정의 오버헤드로 인해 GPU를 효율적으로 활용하지 못하고 또한 GPU에서 병렬로 수행할 수 있는 연산들을 병렬로 수행하지 못한다는 것을 밝혀냈다. 연구팀은 이러한 문제를 해결하기 위해 사전에 스케줄링 과정을 한 번만 하고 여러 개의 GPU 스트림을 사용해 다수의 GPU 연산을 동시에 수행하는 인공지능 시스템 님블을 개발하였다. 님블은 파이토치 대비 인공지능 추론을 22.3배, 학습을 3.6배 빠르게 수행하며 인공지능 추론 특화 시스템인 엔비디아(NVIDIA)의 텐서RT(TensorRT)보다 2.8배 빠르게 인공지능 추론을 수행한다. 또한 님블은 개발 시 사용자 편의성을 고려해 설계되었다. 코드를 몇 줄만 수정하면 기존에 사용하던 파이토치 모델을 님블을 이용해 수행할 수 있다.

이번 연구 결과는 12월 온라인 개최 예정인 인공지능 분야 세계 최고 학회 뉴립스(Neural Information Processing Systems·신경정보처리시스템학회)의 스포트라이트(spotlight) 세션에서 발표될 예정이다. 이 스포트라이트 세션은 올해 뉴립스에 제출된 9467편의 논문 중 약 상위 4%의 논문에만(구두 세션: 105편, 스포트라이트 세션: 280편) 주어지는 발표 기회이다.

전병곤 교수는 이번 개발에 대해 “세계를 선도할 인공지능 플랫폼 기술을 발표하게 되어 기쁘다. 앞으로 활발히 인공지능 플랫폼 기술을 연구하고 사업화하는 데 주력하겠다”고 소감을 말했다.

윤소영 기자

ericahue@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

초기투자AC협회, 글로벌 엔젤투자 국제기구 WBAF와 협약 갱신

초기투자액셀러레이터협회(이하 협회)는 바레인의 수도 마나마에서 열린 2024 WBAF Global Congress에서 WBAF(World Business Angels Investment Forum)와 글로벌 파트너스 업무협약을 체결했다고 22일...

스노우플레이크, 마이크로소프트 파워 플랫폼 전용 커넥터 출시

글로벌 AI 데이터 클라우드 기업 스노우플레이크(Snowflake)는 미국 워싱턴주 시애틀에서 개최된 연례 개발자 컨퍼런스 마이크로소프트 이그나이트(Microsoft Ignite)에서 마이크로소프트 파워 플랫폼(Microsoft Power...

삼성전자, 차세대 AI '가우스2' 공개..."기존 오픈소스 모델보다 3배 빨라"

삼성전자가 자체 개발한 2세대 생성형 AI 모델 '삼성 가우스2'를 공개했다. 기존 오픈소스 AI 모델 대비 처리 속도가 최대 3배 빠르고, 다양한 형태의 데이터를 동시에 처리할 수 있는 것이 특징이다.

대화형 AI 에이전트 ‘젠투’, ‘98% 고객 붙잡는 커머스 전략’ 웨비나 개최

대화형 인공지능(AI) 에이전트 ‘젠투(Gentoo)’ 개발사 와들은 ‘이탈하는 98%의 고객을 붙잡는 온라인 커머스 성공 전략’을 주제로 웨비나를 개최한다고 21일 밝혔다. 와들...