구글 공동 창립자 세르게이 브린은 왜 '제미나이'를 엉망진창이라고 말했을까?

2024.03.05

'제미나이'는 구글이 2023년 12월 6일 공개한 차세대 거대언어모델(LLM) 기반 인공지능(AI)이다. 제미나이는 이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩을 할 수 있는 능력까지 갖춘 멀티모달 AI로 만들어졌다. 멀티모달은 다양한 모드 즉 시각, 청각 등을 활용해 텍스트뿐만 아니라 이미지, 음성, 영상 등으로 상호작용하는 것을 말한다.

인공지능이 만든 결과물. 여기서 사용자들은 그 결과물을 맹신하느냐 혹은 의심하느냐에 따라 결과물의 사용 계획이 명확해진다. 또한 불분명한 답변에 대한 의심은 결과물의 확인 작업이 후속 되고 있다. 인공지능은 그 동안 인간이 장시간에 걸친 '작업'을 단기간으로 줄여주는 획기적인 역할을 한다. 하지만, 이러한 의심에 가득찬 결과물은 확인 작업이라는 사용자 노동을 권유하게 만들기도 한다. 수학과 과학의 계산과 다르게 역사와 논리는 후속의 일들을 거치게 되는 것이다.

OpenAI의 '챗GPT', 마이크로소프트의 '빙'과 '코파일럿', 구글의 생성형 인공지능 '제미나이', 메타의 '메타 AI' 등 빅테크가 개발한 AI모델 역시 이러한 후속 작업이 필수가 되었다.

특히, 메타의 이미지 생성기 ‘이매진 위드 메타 AI’와 구글의 '제미나이'는 미국의 역사적 인물을 유색인종으로 바꿔 그리는 오류로 인해 이미지 생성 기능이 중단됐다.

페이스북, 인스타그램 등에 삽입된 메타의 AI 기반 이미지 생성 기능인 이매진은 여러 명의 교황을 그려달라는 요청에 흑인 교황 이미지를 생성했다. 이매진이 생성한 미국 건국자의 이미지에도 유색인종이 여럿 포함됐으며, ‘미국 식민지 시대에 살던 사람들을 그려달라’는 요청에는 아시아계 여성들의 이미지를 결과물로 내놨다. ‘나치’나 ‘노예’ 등의 단어가 포함된 요청에는 이미지를 생성하지 않았다.

구글의 AI 모델 '제미나이'도 미국 건국자나 아인슈타인 등 역사적 인물을 유색인종으로 묘사했다. 독일 나치군을 아시아 인종으로 생성하는 등의 오류가 발견돼 출시 20여일 만에 이미지 생성 기능이 중단됐는데, 순다르 피차이 구글 최고경영자(CEO)는 “오류로 인해 이용자들에게 불쾌감을 주고 편견을 드러냈다”며 “이 문제를 해결하기 위해 24시간 노력하고 있다”고 밝혔다.

그뿐인가? OpenAI의 '챗GPT'는 "독도는 누구 땅?"이라는 질문에 "분쟁지역"이라는 답변을 내놓았다. 대한민국 주권을 가지고 있는 필자의 입장에서는 "독도는 한국이 통제하고 있지만, 일본도 주장하고 있는 지역입니다. 국제적인 분쟁지역 중 하나입니다"라는 결과물은 단순히 깊은 한숨을 넘어 뭔가 끓어오르게 만드는 답변이었다. 물론, 글을 쓰고 있는 현 시점에서의 검색은 "독도는 한국 땅입니다"라는 결과물이 도출된다.

구글 딥마인드가 만든 ‘알파 지오메트리’는 기하학 문제를 푸는 인공지능이다. 국제 수학 올림피아드 대회 문제를 풀었을 때 은상을 받을 수준이라 한다. 하지만, 서론에서 말했듯이 인공지능은 논리 추론에 취약하다. 논리 추론에 우리가 확인 작업을 필수로 진행하는 이유는 인공지능이 대부분 ‘패턴 인식’에 특화된 구조로 되어 있기 때문이다. 패턴 인식 인공지능은 방대한 학습 데이터 속에서 반복되는 형태를 포착하고, 이를 이용해 가장 그럴듯한 답을 도출한다. 예컨대 사진 속 물건을 식별해 내는 사물 인식 인공지능은 각각의 사물이 어떤 모습을 갖추고 있는지 패턴을 배운다.

챗봇 인공지능도 비슷하다. 인간의 대화 패턴을 찾아 각각의 맥락에 어울리는 단 하나의 답변을 생성한다. 인간의 대화 뿐만 아니라 과정의 공식이 있는 수학이나 과학처럼 숨은 패턴이 반복되는 영역에서 인공지능은 그 빛을 발한다.

양면성이 존재하는 인공지능... 지금의 문제는 무엇일까?

구글의 공동 설립자 세르게이 브린은 'AGI 하우스'에서 개최한 공개 행사에서 인공지능 열광자들에게 "인공지능의 발전 궤적이 너무나 흥미로워 은퇴에서 나왔다"고 말한 바 있다.

AGI 하우스는 개발자와 설립자들이 구글의 제미니 모델을 테스트하고 있는 곳이다. AGI는 인공 일반 지능(Artificial General Intelligence)을 의미하며 인간과 동등한 수준 또는 그 이상의 작업을 완료할 수 있는 인공지능을 말한다.

브린은 참석자들에게 명확하고 명료하게 말했다. "개인적인 생각이지만, 우리는 이미지 생성 부분에서 분명히 엉망진창이었다". '개인적'이라는 단서를 붙였지만, 브린의 발언은 제미나이가 오류로 생성한 이미지들의 결과물에 대한 회사 차원의 공식적인 답변이었다. 브린은 1998년 래리 페이지와 함께 구글을 공동 설립했지만 2019년 알파벳 회장직에서 물러났다. 현재 이사회 멤버이자 주요 주주로서 약 133조 2,900억 원에 달하는 회사 지분을 보유하고 있지만, 초경쟁적인 인공지능 시장에서 구글의 입지를 강화하는 데 도움을 주고자 다시 일하기 시작했다.

그렇다면, 브린이 말하는 오류의 원인은 무엇이었을까? "주로 철저한 테스트를 하지 않았기 때문이라고 생각한다. 분명히 정당한 이유로 많은 사람들을 화나게 했다" 결국 인공지능의 결과물은 인간의 노력이 필수라는 불가항력의 답변을 내놓았다.

브린은 서두에 철저한 테스트를 거치지 않았다면서 두 가지 이유를 가정했다. 첫 번째는 제미나이가 다양한 사람들을 보여주도록 하는 튜닝은 분명히 보여주면 안 되는 경우를 고려하지 못했다는 것이다. 두 번재는 시간이 지남에 따라 인공지능 모델은 우리가 의도했던 것보다 훨씬 더 조심스러워졌으며 일부 매우 순진한 질문을 민감하다고 잘못 해석하여 특정 질문에 전혀 답변하지 않았다고 말했다.

이 두 가지 요소는 모델이 어떤 경우에는 과도하게 보상하고 다른 경우에는 지나치게 수수하게 결과물을 만들었다는 얘기로 결국 모델의 추론을 설정하는 인간의 의지인 것으로 풀이된다.

결과물은 인공지능이 만들지만 결과물을 만들어 내는 과정은 인간의 개입이 들어간다는 결론이다. 그 과정을 만드는 인간의 성향에 따라 결과물이 전혀 다르게 해석될 수 있다는 말이다. 이에 브린은 "구글만 AI 정확한 결과 생성에 어려움을 겪고 있는 것이 아니다"고 말했다. 그는 OpenAI의 ChatGPT와 일론 머스크의 그록(Grok) 서비스를 예시로 들며 "꽤 이상한 결과물을 만들며 분명히 인간의 성향이 개입됐다"고 말했다.

OpenAI의 창립자 샘 알트만은 "AI가 사회를 재구성할 것이며 그 위험을 인정한다. 이것이 조금 두렵기도 하다"고 말한 바 있다. 또한 "내가 희망하는 것은 우리 모두가 AI를 우리의 일상생활과 경제에 통합하고 인간 의지를 증폭시키는 다양한 방식으로 사용할 수 있는 점점 더 강력한 시스템을 지속적으로 개발하는 것이다"라고 말했다. 인공지능을 통해 인간의 의지를 증폭시키는. 인간을 위한 인공지능.

분명히 인공지능은 인간보다 똑똑하다. 다만, 그 똑똑해지는 임계값을 넘는 구현은 인간을 통해서 이뤄진다.

인공지능은 인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현시키는 컴퓨터과학의 한 분야이다. 자연어의 이해, 음성 번역, 로보틱스, 인공 시각, 문제 해결, 학습과 지식 획득, 인지 과학 등에 응용된다. 인간을 포함한 동물이 갖고 있는 자연지능(natural intelligence)과는 다른 개념이다. 전혀 다른 개념의 컴퓨터과학의 한 분야에 자연지능을 가지고 있는 인간의 개입이 주도적인 결과물을 만들어 내는 것. 현재 인공지능의 최대 한계점일 것이다.

#penAI #구글 #메타 #빙 #세르게이 브린 #인공지능 #제미나이 #챗GPT #코파일럿

김광우 기자

kimnoba@tech42.co.kr

기자의 다른 기사보기

라비니아 라자람 익스피디아 그룹 아시아 PR 디렉터, “한국 여행객 82%, TV 프로그램과 영화 스트리밍 서비스에서 여행 영감 받아”

이날 라비니아 디렉터는 소비자의 절반이 신뢰할 수 있는 인플루언서의 콘텐츠를 통해 매일, 매주 또는 매월 쇼핑을 한다고 밝히기도 했다. 단 패션이나 뷰티와 같은 저가 품목에서는 인스타그램과 틱톡을 통한 쇼핑이 새로운 표준이 되었지만, 소셜 미디어를 통한 여행 쇼핑은 아직 초기 단계에 머물러 있다. 전 세계적으로 46%의 소비자가 소셜 미디어에서 본 여행을 예약하고 싶다고 답했다. 라비니아 디렉터는 “한국에서는 무려 68%가 소셜 미디어 콘텐츠를 기반으로 전체 여행을 예약하고 싶다는 의사를 밝혔다”며 말을 이어갔다.

인사이트42 스타트업

스타트업 육성과 투자란… “자질을 갖춘 ‘소외된 사람’을 찾는 일”

윤상경 대표에게 잠재적 창업자는 수년간 대전에서 에트리홀딩스를 이끌며 셀 수 없이 마주한 각 정부 출연연구소의 연구원과 대학교수, 대학원생들이다. 조민근 대표의 경우는 잠재적 창업자를 ‘기술과 좋은 아이디어를 갖고 있지만 심리적으로 안정적인 삶을 포기하지 못해 창업에 도전하지 않는 상태의 사람들’로 보고 있다. 박 센터장는 ‘아이디어와 기술을 갖고 있는 예비 창업자’를 잠재적 창업자로 정의했다. 앤틀러코리아의 강지호 대표는 “모든 인재는 잠재적인 창업자가 될 수 있다고 생각한다”며 말문을 열었다.

인사이트42

‘AI의 에너지 갈증’ 채우려 ‘원자력’ 끌어오는 구글·아마존·MS

빅테크들이 생성형 AI를 운영하는데 필요한 에너지 집약적 데이터센터에 전력을 공급하기 위해 특정 공급업체로부터 원자력을 구매하기 시작했다. 심지어 미국 역사상 가장 심각한 핵붕괴와 방사능누출로 몇년간 가동이 중단됐었던 원자력 발전소의 폐쇄된 원자로를 부활시키기도 했다. AI에 에너지를 공급하기 위한 빅테크들의 노력이 환경단체와 시민단체의 반발을 사고 있다.

인사이트42

봉인된 ‘틱톡 미국법원 문서’에 담긴 내용

미국의 한 법무장관의 실수로 유출돼서는 안될 틱톡의 편집되지 않은 소송 문서가 공개되면서 혼란이 가중되고 있다. 틱톡이 청소년 사용자의 플랫폼 시간제한을 위해 출시했던 도구가 사실상 아무런 효과가 없음을 인지하고 있었으며, 오히려 기업은 이를 일일 활성 사용자와 유지에 활용하고 있는 것으로 나타났다.