국내 연구진, GPU 메모리 시스템 개발 '메모리 용량 8배 늘리고 1.8배 빠르게'

그래픽처리장치(GPU) 메모리 용량을 최대 8배 늘리고 1.8배 빠르게 만드는 GPU 메모리 시스템 기술이 국내 연구진에 의해 개발됐다.

KAIST 연구팀(KAIST 전기및전자공학부 컴퓨터 아키텍처 및 운영체제 연구실)은 3D XPoint 메모리(이하 XPoint)와 DRAM을 통합한 이종 메모리 시스템과 광 네트워크를 활용해, 기존 DRAM 및 전기 네트워크 기반의 GPU 메모리 시스템 대비181%의 성능 향상을 성취했다고 2일 발표했다.

연구팀은 이 기술을 '옴-지피유(Ohm-GPU)'라 이름짓고 올해 10월에 열릴 컴퓨터 구조 분야 최우수 학술대회인 `마이크로(International Symposium on Microarchitecture, MICRO) 2021'에 관련 논문(Ohm-GPU: Integrating New Optical Network and Heterogeneous Memory into GPU Multi-Processors)을 발표할 예정이다.

위쪽부터 Ohm-GPU의 구조 개요, Ohm-GPU 메모리 시스템 내부 구조와 광 네트워크 인프라, Ohm-GPU 메모리 시스템 내부 구조와 광 네트워크 인프라(자료=KAIST)

연구팀이 제안한 ‘Ohm-GPU’는 광 네트워크(O)와 이종(h) 메모리(m)를 활용해 용량과 대역폭을 동시에 향상시킨 GPU 메모리 시스템이다. 이 기술은 XPoint와 DRAM을 통합한 이종 메모리 시스템을 사용하고, 전기 네트워크를 광 네트워크로 대체했다.

XPoint는 DRAM에 비해 용량이 크지만 데이터 전송 속도가 느리다. 반면 DRAM은 XPoint에 비해 데이터 전송 속도가 빠르지만 용량이 작다. DRAM을 단독으로 사용하는 메모리 시스템은 낮은 메모리 용량과 좁은 데이터 전송 대역폭으로 인해 연산 성능을 충분히 활용하지 못한다는 문제가 있다. 대안으로 XPoint를 쓰면 8배 큰 메모리 용량을 얻을 수 있는 반면 읽기/쓰기의 성능이 4배, 6배로 낮아진다.

정 교수팀이 개발한 Ohm-GPU 기술은 대용량 XPoint와 고성능의 DRAM을 통합한 이종 메모리 시스템을 채택함으로써, 기존 메모리 시스템과 동일한 성능을 가지면서도 메모리의 용량을 증가시켰다.

또한, 구리선 전기채널의 통신 대역폭 한계를 극복하기 위해 단일 광 채널로 서로 다른 파장의 다중 광신호를 전달할 수 있는 광 네트워크를 채용했다. 다수의 메모리 컨트롤러가 단일 광 채널을 이용해 데이터를 전송하며, 메모리는 광 디멀티플렉서(demultiplexer)를 이용해 통신하려는 파장의 데이터만 받는다.

이 기술은 GPU 내부에 있는 메모리 컨트롤러 및 인터페이스를 수정해 이종 메모리의 모든 메모리 요청을 광신호로 처리한다. 메모리 요청은 일반적으로 DRAM 캐시 메모리에서 처리되지만, DRAM에 없는 데이터는 XPoint로부터 읽어와야 한다. 연구팀은 이때 발생하는 이종 메모리 간 데이터 이동의 오버헤드(대기 시간)를 완화하기 위한 최적화 설계를 수행했다.

연구팀은 "이 기술로 기존 DRAM을 단독으로 사용하는 전기 네트워크 기반의 GPU 메모리 시스템과 비교해 다양한 그래프처리, 과학응용 실행 등에서 181%의 성능 향상을 달성했다"고 밝히고 "인공지능(AI), 빅데이터, 클라우드 컴퓨팅 등 대용량, 고대역폭의 데이터 전송을 요구하는 고성능 가속기의 메모리 시스템을 대체할 수 있을 것"으로 기대했다.

정명수 교수는 "GPU 메모리 시스템 기술은 일부 해외 유수 기업이 주도하고 있지만, 이번 연구성과를 기반으로 GPU 및 GPU와 유사한 모든 고성능 가속기 메모리 시스템 관련 시장에서 우위를 선점할 가능성을 열었다는 점에서 의미가 있다"고 강조했다.

연구에 대한 자세한 내용은 연구실 웹사이트(http://camelab.org)에서 확인할 수 있다.

이재구 기자

jklee@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

삼성전자, 차세대 AI '가우스2' 공개..."기존 오픈소스 모델보다 3배 빨라"

삼성전자가 자체 개발한 2세대 생성형 AI 모델 '삼성 가우스2'를 공개했다. 기존 오픈소스 AI 모델 대비 처리 속도가 최대 3배 빠르고, 다양한 형태의 데이터를 동시에 처리할 수 있는 것이 특징이다.

대화형 AI 에이전트 ‘젠투’, ‘98% 고객 붙잡는 커머스 전략’ 웨비나 개최

대화형 인공지능(AI) 에이전트 ‘젠투(Gentoo)’ 개발사 와들은 ‘이탈하는 98%의 고객을 붙잡는 온라인 커머스 성공 전략’을 주제로 웨비나를 개최한다고 21일 밝혔다. 와들...

토스인컴, ‘숨은 환급액 찾기’ 서비스 이용 고객 대상 토스포인트 지급 이벤트

비바리퍼블리카(이하 토스)의 자회사 토스인컴은 셀프 세금관리 서비스인 ‘숨은 환급액 찾기’ 를 이용하는 고객을 대상으로 토스포인트 지급 이벤트를 연다고 21일 밝혔다....

제클린, 월간슈즈 ‘베이크솔’과 협업… ‘친환경 패션’을 위한 특별한 동행

기후테크 스타트업 제클린은 벌커나이즈 스니커즈 브랜드 ‘베이크솔(Bakesole)’의 월간슈즈와 기후위기 대응과 ESG 경영 실천을 위한 업무협약(MOU)을 체결했다고 21일 밝혔다. 양사는 이번...