Artificial intelligence (AI) chip developer Nvidia has been sued for using copyrighted works without permission to train its AI platform, NeMo. The three authors - Brian Keene, Abdi Nazemian, and Stewart O’Nan - claimed that their works were included in a dataset of approximately 196,640 books, that the dataset was used to train the NeMo AI platform to simulate common sentences. The dataset was removed in October of last year after receiving a copyright infringement complaint. "The removal of the dataset constitutes an admission by Nvidia that it used the dataset to train NeMo," the authors claimed in a class action lawsuit filed Friday night in federal court in San Francisco. As such, the authors are seeking damages for people in the United States who used their copyrighted works to train Nemo's large language model over the past three years.
인공지능(AI) 칩 개발 기업 엔비디아(Nvidia)가 저작권으로 보호받는 작품을 허가 없이 사용하여 자사의 인공지능 플랫폼인 네모(NeMo)를 훈련했다는 이유로 소송을 당했다. 브라이언 킨, 압디 나제미안, 스튜어트 오난 등 등 세 명의 작가들은 자신들의 저작물들이 약 196,640권의 서적 데이터 세트에 포함되어 있었으며, 이 데이터 세트는 NeMo AI 플랫폼이 일반적인 문장을 시뮬레이션하도록 훈련하는데 사용되었다고 주장했다. 이 데이터 세트는 저작권 침해 접수 신고를 받고 지난해 10월에 삭제되었다. 작가들은 샌프란시스코 연방 법원에 금요일 밤 집단 소송을 제기하면서 "데이터 세트 삭제는 엔비디아가 네모를 훈련하는 데 데이터 세트를 사용했다는 것을 시인한 것"이라고 주장했다. 이에 따라 작가들은 지난 3년 동안 네모의 대용량 언어 모델 훈련에 저작권이 있는 작품을 사용한 미국 내 사람들에 대한 손해배상을 청구하고 있다.