뉴스사이트의 AI 봇 차단 전쟁...'robots.txt'가 경영적 판단 영역

Data journalist Ben Welsh's analysis shows that about 25% of US-based English news websites are blocking Apple's AI bot 'Applebot-Extended', lower than OpenAI's bot (53% blocked) and Google-Extended (43% blocked). Many news publishers have licensing agreements with AI companies, influencing their bot-blocking decisions. Condé Nast's unblocking of OpenAI's bots after their partnership exemplifies this trend. Buzzfeed blocks all AI web-crawling bots without partnerships. The complexity of managing robots.txt files has led some companies to use automatic update services. Robots.txt management has become a concern for media executives, with some CEOs of major media companies directly deciding which bots to block.

데이터 저널리스트 벤 웰시의 분석에 따르면, 미국 기반 영어 뉴스 웹사이트의 약 25%가 애플의 AI 봇 'Applebot-Extended'를 차단하고 있다. 이는 오픈AI 봇(53% 차단)과 Google-Extended(43% 차단)에 비해 낮은 수치다. 많은 뉴스미디어들이 AI 기업들과 라이선스 계약을 맺고 있으며, 이는 봇 차단 여부에 영향을 미치는 것으로 보인다. 콘데 나스트와 오픈AI의 파트너십 체결 후 봇 차단이 해제된 사례가 이를 뒷받침한다. 버즈피드는 파트너십이 없는 모든 AI 웹 크롤링 봇을 차단 목록에 올린다고 밝혔다. robots.txt 파일 관리의 복잡성으로 인해 일부 기업은 자동 업데이트 서비스를 이용하고 있다. 이제 robots.txt 관리는 웹마스터뿐만 아니라 미디어 경영진의 영역이 되고 있으며, 일부 대형 미디어 기업 CEO들이 직접 차단할 봇을 결정하고 있다.

Major Sites Are Saying No to Apple’s AI Scraping

앨리스

ai@tech42.co.kr
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

화웨이, 안드로이드 없는 자체 OS '하모니OS 넥스트' 출시

Huawei unveiled its first fully self-developed mobile operating system, 'HarmonyOS NEXT'.

뉴타닉스, 신규 고객 확보 증가 및 매출 성장

Nutanix announced that its annual recurring revenue increased by 18% and revenue rose by 16% in its recent first-quarter earnings report.

"퀄컴 의존도 줄이려는 샤오미, 2025년 자체 스마트폰 칩 출시"

샤오미가 자체 설계한 스마트폰 프로세서를 2025년에 출시할 준비를 하고 있다는 블룸버그 보도가 나왔다. 이는 퀄컴(Qualcomm)과 미디어텍(MediaTek) 등 외국 공급업체에 대한...

우버, AI 데이터 라벨링 사업 진출

우버가 새로운 AI 주석 및 데이터 라벨링을 위한 긱 워커 부문인 ‘스케일드 솔루션스(Scaled Solutions)’를 출범했다. 이 부문는 우버 내부의 필요를...