"17만 개 유튜브 영상, AI 기업들 무단으로 학습"

An investigation by Proof News and Wired revealed that over 170,000 YouTube videos were part of a massive dataset used to train AI systems for major tech companies. Apple, Anthropic, Nvidia, and Salesforce are among those who used the 'YouTube Subtitles' data extracted without permission. The dataset includes subtitles from videos of popular creators and major news outlets. YouTube has not immediately responded to the findings. AI companies rarely show transparency about the data used in their AI systems. In previous interviews, YouTube CEO Neal Mohan stated that using video content for AI training would violate the platform's terms. Google CEO Sundar Pichai agreed with this assessment, emphasizing the importance of abiding by terms and conditions when building products.

조사에 따르면, 주요 빅테크 기업들이 AI 훈련을 위해 17만 개 이상의 유튜브 동영상을 데이터셋으로 활용했다고 밝혀졌다. 애플, 앤스로픽, 엔비디아, 세일즈포스 등이 허가없이 유튜브에서 추출한 '유튜브 자막(YouTube Subtitles)' 데이터를 사용했다. 이 데이터셋에는 MrBeast, Marques Brownlee 등 유명 크리에이터와 주요 뉴스 매체의 영상 자막이 포함되어 있다. 유튜브는 이에 대한 즉각적인 답변을 하지 않았다. AI 기업들은 자사 AI 시스템에 사용된 데이터에 대해 거의 투명성을 보이지 않고 있다. 유튜브 CEO는 이전 인터뷰에서 AI 훈련을 위한 동영상 콘텐츠 사용이 플랫폼 이용약관을 위반한다고 말한 바 있다. 구글 CEO도 이러한 견해에 동의했다.

Apple, Anthropic, and other companies used YouTube videos to train AI

버트

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

아마존 AWS, 조지아주에 110억 달러 규모 AI 인프라 투자 발표

Amazon's cloud computing division, Amazon Web Services (AWS), is making a major investment in Georgia.

게티이미지, 셔터스톡 인수...글로벌 최대 사진 기업 탄생

글로벌 최대 스톡 포토 기업 게티이미지가 경쟁사 셔터스톡과 현금·주식 방식의 합병을 발표했다.

메타 직원들, 팩트체크 중단과 다나 화이트 이사 선임에 반발

Meta employees strongly opposed the company's decision to end third-party fact-checking ahead of President-elect Donald Trump's inauguration.

메타, 팩트체크 전면 폐지...저커버그 '표현의 자유' 강조

메타가 팩트체크 프로그램을 전면 폐지하고 X(구 트위터)와 유사한 커뮤니티 주도형 시스템으로 전환한다고 발표했다. 마크 저커버그 CEO는 정치·사회적 환경 변화에 따라 표현의 자유를 확대하겠다며 주요 정책 변경을 예고했다