서울대 공대 전병곤 교수팀, AI 학습 및 추론 수행 시 기존 대비 22배 빠른 님블 시스템 개발

 

서울대학교 컴퓨터공학부 전병곤 교수 연구팀이 그래픽 처리 장치(GPU)를 활용해 인공지능 학습과 추론 수행 시 기존 시스템 대비 최대 22배 빠른 님블(Nimble) 시스템을 개발했다고 30일 밝혔다.

이 시스템을 통해 응용 서비스에서 인공지능 모델을 곧바로 고속 수행하는 것이 가능해져 다양한 분야에서 인공지능 모델의 효율적 사용이 가능할 것으로 기대된다. 현재 수많은 기업과 연구소가 인공지능 계산의 편의성을 위해 파이토치(PyTorch), 텐서플로우(TensorFlow) 등의 인공지능 시스템을 사용하고 있다. 이러한 시스템들은 인공지능 학습과 추론 수행 속도 향상을 위해 GPU를 이용한다. GPU에 연산 수행을 요청하기 전에는 이를 위한 준비를 하는 스케줄링(scheduling) 과정을 매번 진행한다.

전병곤 교수 연구팀은 현 인공지능 시스템들이 스케줄링 과정의 오버헤드로 인해 GPU를 효율적으로 활용하지 못하고 또한 GPU에서 병렬로 수행할 수 있는 연산들을 병렬로 수행하지 못한다는 것을 밝혀냈다. 연구팀은 이러한 문제를 해결하기 위해 사전에 스케줄링 과정을 한 번만 하고 여러 개의 GPU 스트림을 사용해 다수의 GPU 연산을 동시에 수행하는 인공지능 시스템 님블을 개발하였다. 님블은 파이토치 대비 인공지능 추론을 22.3배, 학습을 3.6배 빠르게 수행하며 인공지능 추론 특화 시스템인 엔비디아(NVIDIA)의 텐서RT(TensorRT)보다 2.8배 빠르게 인공지능 추론을 수행한다. 또한 님블은 개발 시 사용자 편의성을 고려해 설계되었다. 코드를 몇 줄만 수정하면 기존에 사용하던 파이토치 모델을 님블을 이용해 수행할 수 있다.

이번 연구 결과는 12월 온라인 개최 예정인 인공지능 분야 세계 최고 학회 뉴립스(Neural Information Processing Systems·신경정보처리시스템학회)의 스포트라이트(spotlight) 세션에서 발표될 예정이다. 이 스포트라이트 세션은 올해 뉴립스에 제출된 9467편의 논문 중 약 상위 4%의 논문에만(구두 세션: 105편, 스포트라이트 세션: 280편) 주어지는 발표 기회이다.

전병곤 교수는 이번 개발에 대해 “세계를 선도할 인공지능 플랫폼 기술을 발표하게 되어 기쁘다. 앞으로 활발히 인공지능 플랫폼 기술을 연구하고 사업화하는 데 주력하겠다”고 소감을 말했다.

윤소영 기자

ericahue@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

베스핀글로벌, ‘헬프나우 AI’ 기반 ‘성동형 스마트 AI 민원 안내 챗봇’ 서비스 구축

AI 매니지드 서비스 전문 기업 베스핀글로벌은 자체 AI 에이전트 플랫폼 ‘헬프나우 AI(HelpNow AI)’를 기반으로 성동구청의 ‘성동형 스마트 AI 민원 안내...

XR 공간 컴퓨팅 기업 딥파인, 디지털 공간 구축 관련 기술 2건 특허 등록

XR 공간 컴퓨팅 플랫폼 기업 딥파인은 디지털 공간 구축과 관련한 신규 기술 특허 2건을 등록하며 운영 솔루션의 기술 경쟁력을 강화했다고...

레인보우로보틱스, 이롭과 협력… 차세대 의료용 로봇 개발 본격화한다

로봇 플랫폼 전문기업 레인보우로보틱스는 외과용 의료기기 제조 전문기업 ‘이롭’과 협력해 차세대 의료용 로봇 개발을 본격적으로 진행한다고 23일 밝혔다. 이를 위해...

풀필먼트 품고, 신규 풀필먼트 센터 오픈… 안정적인 수도권 당일 배송 서비스 기대

 풀필먼트 서비스 ‘품고(Poomgo)’ 운영기업 두핸즈는 최근 급증하는 물량과 신규 계약 고객사들을 안정적으로 지원하기 위해 신규 풀필먼트 센터를 오픈했다고 23일 밝혔다....