AI를 완성하는 필요충분 기술 조건은?

[AI 요약] 올해 빅테크의 핵심 키워드는 인공지능으로 고객에게 제공되는 기업들이 AI 기술을 적용해야 하는 수준이다. 하지만 대부분의 AI 서비스는 빅데이터를 기반으로 하기 때문에 필요한 충분한 데이터가 있어야 풍부하고 원활한 서비스가 이뤄질 수 있다.


AI 분석을 위한 '데이터 준비' 작업과 AI 앱 성능 좌우하는 '스토리지'

2021년 새해가 시작됐다. 올해 빅테크의 핵심 키워드는 누가 뭐라고 해도 인공지능(AI)이다. 어떤 식으로든 온라인 서비스를 소비자와 고객에게 제공하는 기업이라면 AI 기술을 적용해야 하는 수준이다. 다양한 AI 기술과 서비스가 나오고 있는데, 좀 더 깊이 AI 서비스를 완성해 주는 기술 요소를 들여다 보고자 한다.

대부분의 AI 서비스는 빅데이터를 기반으로 한다. 서비스를 위해 필요한 충분한 데이터가 있어야 풍부하고 원활한 서비스가 이뤄진다. 또한 AI 애플리케이션 성능을 좌우하는 중요 요소로 스토리지와 같은 기본 인프라가 잘 갖춰져 있어야 한다. AI 서비스를 위한 여러 요소들 가운데, 이 2가지 요소에 대해 알아보자.

AI 분석을 위한 데이터 준비작업...어떻게 해야 할까

인공지능(AI), 그리고 AI를 활용한 데이터 분석은 이제 기업들이 반드시 갖춰야 할 기술 목록 중 가장 윗자리에 존재한다. AI의 중요성이 커지면 커질 수록, 그 뒷단에서 필요한 AI 시스템 완성을 위한 도구들이 있다.

바로 데이터 준비 도구다. 이러한 도구는 데이터 시각화, 통계, 분석, 머신러닝과 관련된 도구들이다.

과거에는 개발자가 직접 기업 내 IT부서의 도움을 받아서 데이터 분석을 했다. 개발자에 요구를 받은 IT부서는 데이터 세트를 ETL 작업을 통해 전달했는데, 데이터가 그리 많지 않았던 시절이였기에 이런 구식 데이터 분석 작업에 큰 불편함은 없었다.

그러나 빅데이터 시대가 돼버린 오늘날의 현실은 사뭇 달라졌다. AI 기술 적용을 위해 필요한 기업의 데이터 분석 작업을 뒷받침 하려면, 방대한 데이터의 양 탓에 전통적 방식으로는 작업 자체가 불가능해졌다.

이 때문에 최근에는 머신러닝 기반의 데이터 준비 작업 솔루션이 등장했을 정도다. 전통적 방식으로 데이터 분석을 위한 사전 준비작업을 하거나, 셀프서비스 방식으로 사용자가 직접 데이터 준비 작업을 했을 할 경우 분석 결과의 품질에 큰 영향을 끼치게 되기 때문이다.

이에 대해 유클릭 AI사업본부 김광정 상무는 "AI 적용을 통한 비즈니스 분석이 중요해 지고 있다"면서, "데이터 준비에 터무니 없이 많은 시간을 허비하고 있어 정작 개발 등 중요한 일에 쓸 시간이 줄어들고 있다"고 설명했다.

데이터 과학자나 데이터 분석가, 그리고 개발자가 데이터 준비 작업과 같은 단순업무에 시간을 낭비하면 정작 중요한 데이터 분석에 소홀해 질 수 있다. 또한 낮은 품질의 데이터 확보로 인한 프로젝트 실패로 이어질 수도 있다.

이 때문에 AI 프로젝트를 위한 데이터 수집에 있어서, 데이터베이스-빅데이터-API와 연계한 원천 데이터에서 데이터를 가져오고, 높은 수준의 최종 데이터 세트를 만들어 머신러닝과 데이터 분석에 활용할 수 있는 솔루션이 필요한 상황이다. 트라이팩타와 같은 솔루션이 대표적이다.

AI 애플리케이션 성능을 위한 스토리지 요구사항

완성도 높은 AI 서비스를 위해 필요한 또 한가지는 스토리지다. 강력한 GPU 클러스터를 갖추고 있다고 해도 데이터 저장장치인 스토리지가 이를 받쳐주지 못한다면 I/O 병목 현상으로 성능 저하가 발생한다.

AI 영역에 있어서는 전통적인 스토리지 계층화에 대한 막연한 믿음에서 벗어나야 한다고 김광정 유클릭 상무는 설명한다. 스토리지를 선택하는 데 성능-용량-비용 모두를 만족할 수 없는 상황이 발생하기에, 스토리지 계층화 접근법이 나왔다. 성능이 뛰어나면 비용이 올라가기에 어쩔 수 없이 어느 하나를 포기했던 부분을 보완하는 것이 계층화다.

스토리지 계층화는 성능이 중요시 되는 업무에는 '올플래시' 스토리지를, 중장기 보관에 필요한 데이터는 '테이프' 스토리지를, 일반적인 환경에서는 '디스크' 스토리지를 사용하는 등 계층을 나누는 방식이다.

그러나 이러한 스토리지 계층화는 AI 시대와 동떨어진 구습처럼 여겨지기 시작했다. AI 시대에는 데이터 증가 속도가 빠르고, 모든 데이터가 하나같이 다 중요해 졌다. 김 상무는 "스토리지 계층화는 최근까지도 기업 전산실에서 스토리지를 도입하는 기준으로 쓰여왔다. 그러나 데이터에 대한 요구사항과 기대수준이 높아지고 있기 때문에 변화가 일어나고 있다"고 말했다.

그렇기 떄문에 AI 시대에 맞는 스토리지 구성이 필요하다. 여기에도 AI 시대에 떠오르는 강자 엔비디아가 빠지지 않고 등장한다. 이를테면 엔비디아 A100 시스템을 기준으로 볼 때, DDR4를 활용하거나 엔비디아의 NVMe 스토리지, 혹은 외장 스토리지를 활용하는데, 성능과 비용 측면에서 NVMe 스토리지가 가성비가 높다고 김 상무는 귀뜸한다.

김 상무는 "AI 시대에 맞는 스토리지 운영 전략은 AI 프로젝트 현장의 필요와 맞아 떨어져야 한다"고 강조한다. 그는 "시행착오를 거쳐 최적의 스토리지 아키텍처를 구성하는 것은 어렵다. 이 때문에 엔비디아와 같은 선도기업이 제공하는 레퍼런스 아키텍처를 참고할 필요가 있다. 각 기업은 AI 워크로드에 맞는 스토리지 운영 전략을 수립하는 데 도움을 받을 수 있다"고 설명했다.

박창선 기자

july7sun@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

전기차 전환 흐름에 퍼펙트스톰···EU거인들이 맞닥뜨린 고통스런 진실

올초부터 서서히 부상하기 시작한 전기차의 낮은 성장세가 유럽의 전기차 제조업체들의 완전전기차 전환 계획을 잇따라 연기 또는 폐기하게 만들고 있다. 세계 자동차 제조업체들이 전기차전환 계획 항로에서 퍼펙트스톰을 맞았다는 분석이 나왔다. 저렴한 모델 부족, 느린 충전소 인프라 확대, 미중 기술경쟁에 따른 중국산 차량에 대한 관세 부과 부담 등이 그것이다. 사진은 완전 전기차로의 전환계획이나 당초 계획한 새 전기차 출시 계획 및 완전전기차 전환 시점을 연기한 볼보와 메르세데스 전기차 컨셉카(왼쪽부터)와 폭스바겐의 차량들이다.

‘AI FOR ALL’, 머신러닝 솔루션으로 몰로코가 만들어가는 ‘AI 수익화’ 혁신

몰로콘24 키노트 발표에 나선 안익진 몰로코 대표. 애플, 구글, 메타 등이 구축한 글로벌 광고 생태계의 영향력을 벗어나 독자적인 머신러닝 솔루션으로 혁신을 선보이는 기업이 바로 몰로코다. 몰로코는 스트리밍 플랫폼·앱·게임·커머스 등의 분야에서 고도화된 자사의 머신러닝 솔루션을 적용해 놀라운 비즈니스 성과를 만들어 냈고, 그 결과 2020년 150억원을 기록했던 매출은 최근 1.5조원으로 100배 급증하며 시장에 놀라움을 던지고 있다. 그러한 몰로코의 성과와 비즈니스 혁신 사례는 최근 서울 삼성동 코엑스 신한카드 아티움에서 개최된 ‘MOLOCON SEOUL 2024: AI FOR ALL’을 통해 소개됐다.

삼성 인도공장 마저…삼성전자 파업은 그저 ‘배부른 소리’ 일까

지난 7월과 8월에 국내에서 진행됐던 삼성전자 파업이 국내를 넘어 인도공장에서도 진행됐다. 삼성전자의 근로자 파업은 국내보다 비교적 외신이 비중있게 다루며 파업의 이유와 근로자 현황을 보여주고 있다. 삼성전자의 근로자 파업은 그저 ‘배부른 소리’일까. 어쩌면 세계 최고 기업의 품격을 이제 보여줘야 할 때는 아닐까.

테슬라 말고는 없나? 최고의 전기차 TOP 9

머스크의 파격적인 행보로 인해 실제로 7월 기준 테슬라 판매량은 2분기 연속 감소했다. 사실 테슬라는 훌륭한 전기차를 만드는 기업으로 평가받고 있기 때문에 안타까운 일이다. 그러나 머스크가 테슬라 전기차 구매를 꺼려지게 하거나 가격적인 부분도 고민이 된다면 다른 좋은 옵션이 많이 있다.