"눈을 감아라! 상상하라! 믿어라!"
책 '맥스웰 몰츠 성공의 법칙'에 나오는 부정적인 자아 이미지를 긍정적으로 바꿔주는 마음 수술법이다. 저자는 경험해보지 않는 것에 대한 두려움을 극복함으로써 성공할 수 있다고 말한다. 보이지도 않고 실체도 없는 것에 대한 두려움은 시작도 하기 전에 절망과 실망을 안겨준다. 우리는 그것을 좌절이라 표현하고 불행이라 생각한다.
그래서 인간은 시작하는 모든 것들에 대한 찬사를 아끼지 않는다.
"인공지능 두려워할 필요 없어..인간의 한계 넓혀줄 것"_레이 커즈와일 구글 엔지니어링 이사
2016년 3월 9일. 전 세계 이목을 집중시키는 인공지능(AI)과 인간 사이에 세기의 대결이 펼쳐졌다. 바둑에서 알파고와 이세돌이 벌인 대국으로 인공지능이 4승을 얻으며 마무리됐다.
"한국은 IT강국이지만 인공지능은 조금 늦었다. 이제는 인공지능이다."_소프트뱅크 손정희 회장
지난 2019년 방한한 손정의 소프트뱅크 회장은 문재인 대통령을 만나 AI 산업에 전폭적인 육성을 제안했다. 문 대통령은 소프트웨어 개발자 모임에 참석해 기조연설에서 '인공지능 국가전략을 제시할 것"이라고 밝히기도 했다.
앞서 손 회장은 외환위기를 겪고 있을 당시 대한민국 경제를 살리기 위한 방법 중 하나로 '초고속 인터넷망'을 제안한 바 있다.
인공지능 강국을 꿈꾸는 우리나라 인공지능의 현실은 어디까지 왔을까.
우리가 일상에서 흔히 접할 수 있는 인공지능 기술로 'AI스피커'를 꼽을 수 있다. 음악을 듣고 TV, 조명을 켜거나 커튼을 움직일 수 있으며 때로는 고민을 들어주는 '상담사'역할까지 한다. 앞으로 AI는 자율주행을 빠르게 개발하는데 도움을 주며 교육과 의료, 보안 및 치안 등 사회 전반적인 분야로 확대 될 전망이다.
이런 AI 개발의 필수 요건은 빅데이터다. 미국의 구글, 애플, 아마존, 페이스북, 테슬라와 중국의 바이두, 알리바바, 텐센트 등은 자사의 방대한 데이터를 기반으로 AI 개발에 앞장서고 있다.
데이터는 기업의 무기이며 차별화다. 데이터의 양에 따라 AI 분야에서 앞서갈 수 있다.
한국은 네이버와 카카오와 같은 토종 플랫폼회사가 존재한다. 하지만 미국과 중국처럼 거대한 인구 기반의 데이터를 수집할 수는 없다. 그에 따라 수집되는 양질의 데이터를 확보도 힘들다.
이에 우리 정부는 '디지털 뉴딜'을 통해 AI를 키우는 노력을 하고 있다. 가장 큰 특징은 데이터 불모지와 같은 한국의 상황에 맞춰 로드맵을 만들어가고 있다는 점이다. 미국과 중국에 비해 적은 양이지만, 확보 된 데이터를 가공하여 양질의 데이터를 만들어 버려지는 데이터를 활용한다. 이를 '차세대 인공지능'이라 명명했다.
전세계적으로 수많은 데이터 속, 양질의 데이터는 생각보다 많지 않다. 구글과 아마존 같은 글로벌 IT기업은 대수의 법칙에 따라 많은 표본 데이터를 수집하여 양질의 데이터를 해결할 수 있지만, 한국은 대수의 법칙을 적용하기가 어렵다. 버려지는 데이터도 가공하여 양질의 데이터로 만드는 것이 차세대 인공지능의 역할이다.
이에 정보통신기획평가원(IITP)에서는 사람중심의 AI강국 실현을 위한 차세대 인공지능 핵심원천기술개발을 위해 예비 타당성 사업 진행하고 있다. 2022년부터 2026년까지 총 5년간 사업비 9,286억원을 지원하고 있으며, 사람 중심의 인공지능 강국 실현을 위한 차세대 인공지능 기반의 핵심원천기술 확보를 목표로 하고 있다. 이를 위해 3개 원천기술 분야로 'AI 성능개선, AI 신뢰확보, AI 활용성개선'으로 나눠 18개 대상 기술로 구성하고 실제 생활에 적용할 수 있는 기술을 검증하고 연계하는 작업을 하고 있다.
엑소브레인
AI에서 한국어를 최적화하는 기술로서 인간수준으로 문장과 문법을 분석할 수 있는 한국어 분석기술, 텍스트 빅데이터를 대상으로 언어와 단어지식을 학습하고 저장하는 지식축적 및 탐색기술이다.
구글이나 애플, 아마존은 영어기반의 플랫폼으로 한국어로 적용하면 오류가 날 확률이 높지만, 한국어에 최적화된 기술을 적용한다면 외산 데이터도 우리에게 맞게 최적화된 AI 기술을 적용할 수 있다.
이 기술이 확장되면 AI스피커에서 들을 수 있는 단답식의 대답들이 서술형으로 대화가 가능해진다. 전문용어와 한자어가 많은 법률분야에 적용이 된다면 변호사를 만나거나 법원을 직접가지 않아도 앉아서 법률상담과 서비스를 받게 된다. 또 금융이나 특허, 상담 분야로 계속적인 발전이 이루어지고 있다. 현재 한국전자통신연구원(ETRI)과 9개 기업, 10개 대학이 해당 연구에 참여 중이다.
딥뷰
실시간 대규모 영상 데이터의 이해 및 예측을 위한 고성능의 시각적 탐색 플랫폼으로 비디오나 영상을 분석해 행동을 이해하고 행동을 추적하는 시스템이다. CCTV영상에서 사람의 행동을 관절 수준으로 정밀하게 인식하는 기술 개발에 적용되고 있다. 사람을 인식하는 기술에서 물건을 내려놓거나 투기하는 행동을 정밀하게 인식하는 AI 기술이다.
세종시와 서울 은평구에서는 딥뷰 기술을 적용해 쓰레기 무단투기 행위를 근절하고 있다. 쓰레기 불법투기장을 지나가다 "투기물이 촬영되었습니다. 투기물을 가지가지 않으면 관련법에 따라 처벌 받게 됩니다"라는 음성을 들어본 기억이 있을 것이다. 범죄나사건을 사전에 감지·예방하기 위한 핵심기술이 될 전망이다. 중국에서는 이미 딥뷰 기술이 들어간 스마트글래스 착용으로 범죄자를 색출하고 있다.
다중 화자간 대화 음성인식 기술
다수의 음성이 섞이거나 외부환경의 소음과 목소리가 섞이면 말을 알아듣기가 힘들다. 음성검색이나 AI스피커, 콜센터의 녹취 음성 등 대상의 근거리 음성 인식 정확도는 90%이상으로 개선되고 있지만, 다수의 화자나 시끄럽고 잡음이 많은 환경의 원거리 대회체 정확도는 60% 정도로 상용화가 힘든 상황이다.
현재 한국전자통신연구원을 필두로 여러 명의 화자가 발성하는 자연스런 대화 내용을 화자별로 분리·분류해서 문자화하고, 감정을 분석하며 텍스트를 정제·강조하여 문서화를 지원하는 인공지능 원천기술을 개발 중에 있다.
해당 기술이 적용 된다면 코로나19 상황으로 다수의 화자가 참여하는 영상회의 때 각각의 대회 내용을 확실히 인식할 수 있으며 사투리나 비원어민의 영어발음 등 일반적이지 않은 발음과 음색 등에 대한 음성인식 성능 향상을 기대할 수 있다.
XAI
AI 알고리즘은 수백만, 많게는 수 십억 개의 입력 데이터를 테스트하고 분석해, 의사결정에 의미 있을 최종 결과를 도출한다. 하지만 그 결과에 이르게 된 근거나 과정을 사람들이 명확하게 이해하지 못하는 경우도 간간이 생긴다.
이에 AI가 내린 결정이나 답을 AI스스로가 사람이 이해하는 형태로 설명하고 제시할 수 있는 설명 가능한 AI가 핵심적인 비즈니스에 대두되고 있다. 단순한 판단의 결정이 아니라 판단을 하기까지의 과정과 이유에 대한 설명이 가능해진다면 의료, 군사 등 응용분야에서의 결과 도출에 대한 과정까지 설명이 되기 때문에 신뢰도를 높힐 수 있다. 인간과 AI의 소통과 협동, 균형있는 관계가 상호작용을 통해 만들어 지는 것이다.
지능적 비디오 이해 지능 및 검증
튜링를 통과할 수 있는 인간 수준의 질의 응답이 가능한 AI의 개발은 많은 AI 개발자들의 숙원이다. 1950년 영국의 수학자 앨런 튜링이 제안한 튜링 테스트는 AI 판별법으로 기계(컴퓨터)가 AI을 갖추었는지를 판별하는 실험이다.
하지만 이를 구현하는 것은 수 많은 기술들이 축적 된 오늘 날에도 쉽지 않은 일이다. VTT(Video Turing Test)사업은 텍스트 기반의 기존 튜링테스트에서 영상기반으로 영상을 보고 내용을 이해 및 설명할 수 있는 AI를 개발 하는게 목표이다.
우리는 이미 블로그에서 유튜브, 넥플렉스로 넘어가는 급격한 영상 산업의 발전을 겪었으며 손 쉬운 영상제작이 가능한 사회를 살고 있다. 그렇게 만들어진 영화나 드라마를 보고 같이 울고 웃는 '인간' 같은 '인공지능'이 개발되는 것이다. 인간 수준의 비디오 이해 지능 및 검증 기술이 발전한다면 영화를 보고 울고 있는 인간을 위로해주는 인공지능이 나타날 것이다.