"'이루다'가 배운 카톡 대화 DB는 모두 증거"

[AI 요약] 사용자들의 일상 대화를 활용해 AI 대화 시스템을 구현하려는 시도는 불법의 영역에서 재판을 받게 되었다. 개발사가 이용자들에게 수집한 카카오톡 대화 내용을 제출하라고 명령하여, 데이터 수집 과정은 모두 증거로 인정되어, 임의로 파기할 수 없게 된 인공지능 기업의 데이터 활용 문제가 본격적인 법정 공방으로 돌입했다.


인공지능(AI) 기업의 데이터 활용 문제가 본격적인 법정 공방으로 돌입했다. 사용자들의 일상 대화를 활용해 AI 대화 시스템을 구현하려는 시도는, 이제 불법의 영역에서 재판을 받게 됐다. 이러한 AI 시스템 구축에 필요한 데이터를 모으는 과정은 앞으로 해당 산업 발전의 열쇠가 될 것으로 보인다.

지난 19일 법원은 AI 챗봇 이루다 개발사인 스캐터랩에 수집했던 카카오톡 대화 내용을 제출하라고 명령했다.

개발사가 이용자들에게 수집한 카카오톡 데이터베이스(DB)는 모두 증거로 인정돼, 이를 임의로 파기할 수 없게 된 것이다. 스캐터랩은 연애 정보 앱 '연애의 과학'을 통해 수집한 실제 연인 카톡 대화 1억 건을 AI 개발에 사용했다.

이 회사가 AI 챗봇을 개발하기 위해서 많은 DB가 필요했다. 그것도 실제 연인들이나 친구랑 이야기 했을 법한 대화체의 말을 모아야 했다. 사람처럼 자연스러운 언어를 구사하는 챗봇을 만들고, 머신러닝을 통해 스스로 학습해서 진화하는 AI를 만드는 것이 목표였기 때문이다.

이를 위해 스캐터랩은 이용자의 카카오톡 대화 100억건을 수집했다. 이 중에 많이 쓰이는 말투나 대화 1억건을 골라서 이루다의 DB에 적용했다.

이 탓에 이루다 출시 이후, 스캐터랩의 또다른 서비스 연애의 과학 사용자 300여 명은 스캐터랩을 상대로 개인정보 유출에 대한 집단 소송을 제기하고 증거 보전을 신청했다. 개인정보 유출 피해를 주장하며 100억건의 카카오톡 원본 DB와 1억건의 이루다 DB 모드 증거로 보전돼야 한다는 것이다.

이에 법원은 스캐터랩에 카카오톡 대화 DB와 이를 가공한 DB, AI가 학습을 통해 이뤄진 대화 내용 모두를 제출하라고 명령했다.

하정림 법무법인 태림 변호사는 "스캐터랩은 실명 등을 불완전 삭제했다. 또한 성적인 대화, 사상, 신념, 영업 비밀 등이 담긴 대화를 그대로 이루다 DB 학습 용도로 사용했고 이를 공개했다"면서, "확보한 DB로 위법 행위를 밝히고 소송을 진행할 것이다"라고 말했다.

서비스 초기 이루다 베타 테스트 모집 공고(출처: 스캐터랩) 
서비스 초기 이루다 베타 테스트 모집 공고(출처: 스캐터랩) 

김광우 기자

kimnoba@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[마루에서 만난 사람] 김연석 제틱에이아이 대표 “AI 기업을 위한 원스톱 온디바이스 AI 전환 솔루션을 만들고 있습니다”

멜란지는 현재 베타 버전 단계에서도 전 세계에 보급된 모바일 NPU의 80%에 적용 가능한 수준이다. 향후에는 아직 지원되지 않은 나머지 20%를 채워 나가는 것이 목표다. 궁극에는 NPU가 적용된 세상의 모든 기기에서 동작하는 온디바이스 AI 서비스를 지원하겠다는 것이다. 김 대표는 그 시점을 언급하며 ‘공존하는 생태계’에 대한 구상을 털어놨다.

‘로보택시 Vs. 자차 자율주행’ 미래 교통의 승자는?

자율주행차 업계가 숨가쁘게 돌아가고 있다. GM이 그동안 투자했던 자율주행 로보택시 기업 크루즈에 대한 투자를 전면 중단한 가운데, 구글 모기업 알파벳의 로보택시 자회사 웨이모는 오히려 사업을 확대하고 있다. 우버는 기존 자율주행차 제조업체에서 유통업체를 전략을 바꾸면서 새로운 시장을 개척하고 있다. 애플은 10년 공들인 자율주행차 사업 포기를 결정했으며 테슬라는 해당 사업을 확대하고 있다.

[마루에서 만난 사람] 문창훈 파워테스크 대표 “어떤 프로세스, 데이터라도 연동할 수 있는 기업용 업무 자동화 플랫폼을 만들었습니다”

문 대표와 파워테스크 팀이 각고의 노력을 거듭해 선보인 ‘아웃코드’는 개발인력이 부족한 중소 스타트업, 중견기업이 맞춤형 업무 자동화 솔루션을 개발할 수 있도록 도와주는 플랫폼이다. 구글시트, 엑셀, 노션 등 이미 기업들이 업무에 사용하고 있는 솔루션의 모든 데이터를 각각의 워크플로우에 자동으로 연동되도록 한 것이 특징이다. 노코드인 만큼 직관적인 환경에서 마우스 클릭만으로 각 회사의 업무 환경에 맞춘 최적화 솔루션을 만들 수 있다.

‘X는 X’ 일론 머스크의 ‘디지털 타운스퀘어’를 탈출하라

언론인, 스포츠클럽, 영화감독과 배우 등 사회 각층 저명한 인사들이 사용자들의 X 이탈 추세에 합류하고 있다. 사용자들은 일론 머스크가 트위터를 인수한 후 X 내에서 인종차별, 동성애 혐오, 반유대주의 등 증오 표현이 증가하고 도덕적 가치가 훼손되고 있다고 비판하고 있다.