NVIDIA appears to have scraped copyrighted content for AI training, according to a report by 404 Media. The company reportedly asked employees to download videos from YouTube, Netflix, and other sources for commercial AI projects, including Omniverse 3D world generator, self-driving car systems, and "digital human" efforts. While NVIDIA claims this practice complies with copyright law, YouTube seems to disagree. Despite ethical and legal concerns raised by some employees, the company's leadership reportedly approved the data collection. NVIDIA also allegedly used datasets marked for academic use only in its commercial AI products and employed methods like virtual machines and IP address rotation to avoid detection by YouTube.
엔비디아가 AI 학습을 위해 저작권이 있는 콘텐츠를 무단으로 수집한 것으로 보인다. 미국의 404 media의 보도에 따르면, 엔비디아는 직원들에게 유튜브, 넷플릭스 등에서 비디오를 다운로드하여 상업용 AI 프로젝트를 개발하도록 요청했다. 이는 옴니버스 3D월드 생성기, 자율주행차 시스템, 디지털 휴먼 등의 제품 개발을 위한 것이었다. 엔비디아는 이 행위가 저작권법을 준수한다고 주장하지만, 유튜브는 이에 동의하지 않는 듯하다. 일부 직원들이 윤리적, 법적 우려를 제기했음에도 불구하고 회사 고위층에서 이미 승인했다고 한다. 엔비디아는 또한 학술용으로만 표시된 데이터셋을 상업용 AI 제품에 사용했으며, 유튜브의 탐지를 피하기 위해 가상 머신과 IP 주소 변경 등의 방법을 사용한 것으로 알려졌다.