세계적인 기술 기업 콘티넨탈은 혁신 기술을 더욱 효율적이고 빠르게 개발하기 위해 엔비디아(NVIDIA) 인피니밴드(InfiniBand)에 연결된 DGX 시스템을 이용한 인공지능(AI) 슈퍼컴퓨터 구축에 투자해왔다.
콘티넨탈 슈퍼컴퓨터는 올해 초부터 독일 프랑크푸르트 암마인(am Main)에 위치한 데이터센터에서 운영되고 있으며 세계 여러 지역의 개발자들에게 컴퓨팅 파워와 저장공간을 제공하고 있다. AI는 첨단 운전자 지원 시스템(advanced driver assistance systems, 이하 ‘ADAS’)을 개선하고 더욱 스마트하고 안전한 모빌리티를 제공하며, 자율주행을 위한 시스템 개발을 가속한다.
콘티넨탈 ADAS 사업부의 크리스티안 슈마허(Christian Schumacher) 프로그램 관리 시스템 총괄은 “콘티넨탈 슈퍼컴퓨터는 우리 미래에 대한 투자”라며 “이 최첨단 시스템을 이용해 최소 14배 많은 실험을 동시에 진행할 수 있기 때문에 신경망 훈련에 소요되는 시간을 단축시킬 수 있다”고 말했다.
◇엔비디아와 협력해 최상의 품질 확보
슈마허 총괄은 “파트너사를 찾을 때 가장 중요하게 고려하는 것이 품질과 속도다. 이번 프로젝트를 야심 차게 준비했고 구현까지 채 1년이 걸리지 않았다”며 “집중적인 시험과 검토를 거쳐 콘티넨탈은 전 세계적으로 가장 빠른 속도의 슈퍼컴퓨터를 다수 구동하고 있는 엔비디아를 선택했다”고 말했다.
엔비디아 엔터프라이즈 컴퓨팅 사업부의 마누비르 다스(Manuvir Das) 총괄은 “엔비디아 DGX 시스템은 콘티넨탈과 같은 혁신기업을 대상으로 비용 효과적이며 구축이 용이한 ‘엔터프라이즈 레디’형 솔루션을 통해 AI 슈퍼컴퓨팅을 제공한다”며 “콘티넨탈은 자율주행 차량의 훈련을 위해 인피니밴드에 연결된 엔비디아 DGX POD를 활용, 가장 지능적인 미래 차량을 설계하고 이를 위한 IT 인프라를 구현하고 있다”고 밝혔다.
◇AI 기반 솔루션을 위한 IT 마스터피스
50개 이상의 엔비디아 DGX 시스템을 사용해 구축된 콘티넨탈 슈퍼컴퓨터는 엔비디아 멜라녹스 인피니밴드(NVIDIA Mellanox InfiniBand) 네트워크에 연결되어 있다. 또 필요에 따라 클라우드 솔루션을 통해 용량과 스토리지를 확장할 수 있도록 하이브리드 방식을 채택하고 있다.
콘티넨탈 슈퍼컴퓨터는 세계 슈퍼컴퓨터의 순위를 발표하는 ‘톱500’에서 자동차 업계 최고의 시스템으로 꼽히고 있다. ADAS는 AI를 활용해 의사결정을 하고 운전자를 보조해 궁극적으로 자율주행을 구현한다. 레이더 및 카메라와 같은 환경 센서는 미가공 데이터(raw data)를 전달한다. 이 미가공 데이터는 지능형 시스템을 통해 실시간으로 처리되어 차량 주변 환경에 대한 종합 모델을 만들어내고 주변 환경과의 상호작용에 관한 전략을 고안해낸다. 최종적으로 차량은 계획된 대로 작동하도록 제어되어야 한다.
그러나 시스템이 점점 복잡해지면서 전통적인 소프트웨어 개발과 머신러닝 방법은 한계에 도달했다. 이에 오늘날 딥러닝과 시뮬레이션이 AI 기반 솔루션 개발 분야의 근본적인 방안으로 자리매김하고 있다.
◇딥러닝, 시뮬레이션 및 가상 데이터 생성에 주로 활용
인공 신경망은 딥러닝을 통해 머신이 경험에 의해 학습하고 새로운 정보를 기존 지식과 연결하는 등 본질적으로 인간의 뇌에서 이루어지는 학습 절차를 모방한다. 그러나 어린이가 다른 차종에 대한 수십여 장의 사진을 본 후 차량을 인식할 수 있는 것과 달리 운전자를 보조하거나 자율주행을 위한 신경망을 훈련시키기 위해서는 수백 만장의 사진과 함께 수천 시간의 훈련이 요구되는 엄청난 양의 데이터가 필요하다.
엔비디아 DGX POD는 이렇게 복잡한 프로세스에 소요되는 시간뿐만 아니라 신기술의 출시 시간도 단축해준다. 헝가리 부다페스트 소재의 콘티넨탈 AI 역량강화센터(AI Competence Center)는 AI 기반 혁신 인프라 개발 작업을 진행하고 있다.
발라즈 로랑(Balazs Lorand) 센터장은 “콘티넨탈 AI 역량강화센터에서는 전반적으로 신경망을 완전하게 훈련시키는데 필요한 시간을 추산하고 있으며 현재 수 주에서 몇 시간으로 단축을 목표로 하고 있다”며 “개발팀은 지난 수년간 규모 및 경험 측면에서 성장해왔으며 슈퍼컴퓨터 구축과 함께 컴퓨팅 파워를 우리의 필요에 맞춰 확장하고 개발자들의 잠재력을 최대한 활용할 수 있게 됐다”고 말했다.
신경망 훈련을 위한 데이터는 주로 콘티넨탈의 테스트 차량에서 확보해왔다. 현재 이 차량들은 매일 1만5000km를 시운전해 100테라바이트의 데이터를 수집하고 있는데 이는 영화 5만 시간에 달하는 분량과 맞먹는다. 이렇게 녹화된 데이터는 재생되어 물리적 시운전을 시뮬레이션함으로써 새로운 시스템을 훈련시키는 데 사용될 수 있다.
슈퍼컴퓨터를 활용한 합성 데이터 생성은 많은 컴퓨팅 파워를 필요로 하는 사례로, 시스템이 시뮬레이션 환경에서 가상 주행한 데이터를 기반으로 하는 학습을 가능하게 한다. 이는 개발 프로세스 측면에서 여러 이점을 제공한다.
첫째 시스템 자체에서 필수적인 훈련 시나리오가 즉시 생성이 가능해서 장기적으로 실제 차량에서 생성된 데이터의 기록, 저장 및 마이닝이 불필요할 수 있다.
둘째 실제 차량이 수 주간에 걸쳐 주행한 테스트 거리를 가상 차량이 단 몇 시간 만에 주행할 수 있게 되어 개발 속도가 빨라진다.
셋째 데이터 합성을 통해 시스템은 변화하는 상황 및 예측 불가한 상황을 처리하고 대응할 수 있다. 최종적으로 차량이 변화가 극심한 악천후 속에서도 안전하게 주행할 수 있도록 하거나 보행자의 움직임에 대한 신뢰할 수 있는 예측을 제공할 것이다. 결국 보다 높은 수준의 자동화를 이룰 수 있다.
확장성은 엔비디아 DGX POD의 콘셉트를 가능하게 한 핵심 요인 중 하나이다. 사람이 제어하는 방식과 비교하면 머신은 기술을 통해 더 빠르고, 우수하게, 종합적으로 학습할 수 있으며 매 진화단계에서 잠재적 성능이 기하급수적으로 높아진다.