뉴스사이트의 AI 봇 차단 전쟁...'robots.txt'가 경영적 판단 영역

Data journalist Ben Welsh's analysis shows that about 25% of US-based English news websites are blocking Apple's AI bot 'Applebot-Extended', lower than OpenAI's bot (53% blocked) and Google-Extended (43% blocked). Many news publishers have licensing agreements with AI companies, influencing their bot-blocking decisions. Condé Nast's unblocking of OpenAI's bots after their partnership exemplifies this trend. Buzzfeed blocks all AI web-crawling bots without partnerships. The complexity of managing robots.txt files has led some companies to use automatic update services. Robots.txt management has become a concern for media executives, with some CEOs of major media companies directly deciding which bots to block.

데이터 저널리스트 벤 웰시의 분석에 따르면, 미국 기반 영어 뉴스 웹사이트의 약 25%가 애플의 AI 봇 'Applebot-Extended'를 차단하고 있다. 이는 오픈AI 봇(53% 차단)과 Google-Extended(43% 차단)에 비해 낮은 수치다. 많은 뉴스미디어들이 AI 기업들과 라이선스 계약을 맺고 있으며, 이는 봇 차단 여부에 영향을 미치는 것으로 보인다. 콘데 나스트와 오픈AI의 파트너십 체결 후 봇 차단이 해제된 사례가 이를 뒷받침한다. 버즈피드는 파트너십이 없는 모든 AI 웹 크롤링 봇을 차단 목록에 올린다고 밝혔다. robots.txt 파일 관리의 복잡성으로 인해 일부 기업은 자동 업데이트 서비스를 이용하고 있다. 이제 robots.txt 관리는 웹마스터뿐만 아니라 미디어 경영진의 영역이 되고 있으며, 일부 대형 미디어 기업 CEO들이 직접 차단할 봇을 결정하고 있다.

Major Sites Are Saying No to Apple’s AI Scraping

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

스페이스X, 달 착륙선 '스타십'으로 루나 아웃포스트 로버 운송 계약

SpaceX has signed a contract to transport Lunar Outpost's rover 'Eagle' to the lunar surface using its moon lander 'Starship'.

백악관에 입성하는 암호화폐...트럼프 자문위원회 경쟁 치열

리플, 크라켄, 서클 등 주요 암호화폐 기업들이 트럼프 당선인이 약속한 암호화폐 자문위원회 참여를 적극 추진하고 있다. 7월 내슈빌 비트코인 컨퍼런스에서...

머스크와 라마스와미, 트럼프의 '정부효율부' 계획 공개

Elon Musk and Vivek Ramaswamy, appointed as co-leads of President-elect Donald Trump's "Department of Government Efficiency" (DOGE), have detailed their plans in an op-ed published in The Wall Street Journal.

미 법무부, 구글 해체 요구... 크롬 브라우저 매각 포함

The U.S. Department of Justice (DoJ) has officially called for the breakup of Google. In a 23-page document, it proposed...