‘챗GPT’를 공격하라! 미국이 해커를 라스베이거스에 집결시킨 이유

[AI요약] 미국이 챗GPT와 바드, 라마2 등 생성형 AI의 약점을 파악하기 위해 해커 지원 훈련 프로그램을 시작했다. 바이든 행정부와 기술 기업들은 이번 프로그램을 통해 AI 모델을 보다 강력하고 안전하게 개발 가능한 피드백과 다양한 관점 수집을 기대하고 있다.

바이든 행정부가 생성 AI 시스템의 약점을 파악하기 위해 고안된 해킹 지원 훈련을 시작했다. (사진=카네기멜론대학교)

미국이 생성 AI 시스템의 약점을 파악하기 위해 고안된 해킹 지원 훈련을 시작한다.

조 바이든 미국 행정부가 챗GPT(ChatGPT) 등 인공지능(AI)을 활용한 사이버 공격 가능성을 가늠하기 위해 고안된 백악관 지원 해킹 훈련 프로그램에 대해 CNN, CNBC 등 외신이 10일(현지시간) 보도했다.

이번 백악관 지원 해킹 훈련은 연례행사인 ‘데프콘 사이버 컨퍼런스’에서 열린다. 컨퍼런스 주최측은 이번 주말부터 수천명의 해커가 라스베이거스에 집결한다고 밝힌 가운데, 이를 통해 생성 AI를 조작할수 있는 새로운 방법을 공개하고 AI 개발자에게 중요한 취약점을 수정할수 있는 기회를 제공할 계획이다.

이번 행사에서 해커들은 오픈AI, 구글, 메타 등을 포함하여 가장 진보된 생성 AI 모델을 보유한 기술 회사와 함께 심지어 백악관의 지원을 받고 있다. ‘레드팀’이라고도 불리는 이번 해커 트레이닝은 AI 컴퓨터 시스템을 한계까지 밀어붙여 악의적인 행위자가 실제 공격을 시작하는 데 사용할 수 있는 결함 및 기타 버그를 식별하는데 집중한다.

주최측은 이틀동안 진행되는 컨퍼런스를 통해 수천명의 신진 해커 또는 경험 많은 해커들이 레드팀 대회에 참가할 것으로 기대하고 있다. 해커 참가자가 AI 시스템의 다양한 버그 또는 불미스러운 행동을 발견하면, 깃발 캡처 형식으로 포인트가 부여되며 추후 승자가 가려진다.

이번 대회는 백악관 과학기술정책실의 ‘AI 권리장전을 위한 청사진’을 중심으로 설계됐다. 지난해 바이든 행정부가 발표한 이 가이드는 기업들이 인공지능을 보다 책임감 있게 개발 및 배치하고 AI 기반 감시를 제한하도록 촉구하기 위해 발표됐다. 다만 현재 이 가이드는 기술 기업들을 강제하지는 않는다.

최근 몇달 동안 미국 카네기멜론대학교 연구팀은 악의적 사용자가 오픈AI, 구글, 메타가 개발한 기타 생성 AI 시스템이 신체적 상해를 유발하는 지침을 제공하도록 속일 수 있음을 발견했다.

현재 대부분의 인기있는 AI챗봇 시스템에는 허위 정보 및 혐오 발언을 퍼뜨리거나 직접적인 해를 끼칠 수 있는 정보를 제공하는 것을 방지하도록 설계된 최소한 몇 가지 보호 기능이 있다. 예를 들어 ‘인류를 파괴하는 방법’에 대한 질문 등이다.

그러나 연구팀은 보호기능을 뚫고 AI가 유해한 답변을 하도록 속일 수 있었다. 연구팀에 따르면 오픈AI의 챗GPT는 사회적 불안을 조장하는 팁을 제공하고, 메타의 라마2는 정신건강 문제가 있는 취약계층을 조작하고 식별할수 있도록 제안했으며, 구글의 바드는 치명적인 바이러스를 출시할 것을 제안했지만 진정으로 인류를 말살하려면 ‘치료에 저항력이 있어야 한다’고도 경고했다.

이러한 가운데 펼쳐지는 라스베이거스 해킹 이벤트에 대해 오픈AI, 구글, 메타 등 기술은 사실상 적극적인 지지를 표명했다. 레드팀 이벤트는 사실 미국 사이버보안업계 전번에 걸친 일반적인 관행으로, 기업들은 이를 통해 시스템의 버그 및 기타 취약성을 파악할 수는 기회를 얻는다.

실제로 앞서 AI의 주요 개발자들은 AI 시스템을 개선하기 위해 레드팀을 어떻게 사용했는지 공개적으로 자세히 설명하기도 했다.

아라티 프라바카 백악관 과학기술정책국장은 “바이든 행정부의 해커 경쟁 지원은 안전한 AI 시스템 개발을 위한 광범위한 전략의 일부”라고 언론을 통해 밝혔다.

오픈AI 대변인은 “컨퍼런스를 통해 AI모델을 더 강력하고 안전하게 만들 수 있는 귀중한 피드백을 수집할 수 있을 것”이라며 “또한 AI 개발을 안내하는 데 도움이 되는 다양한 관점과 더 많은 의견이 모일 것”이라고 밝혔다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[인터뷰] 방은혜 밀리의서재 AI서비스본부장 “AI를 접목한 플랫폼 기반 독서 경험 강화, 기대하셔도 좋습니다”

2016년 등장한 밀리의서재는 오랜 세월 오프라인에 머물고 있던 사람들의 독서 습관을 플랫폼으로 확장하며 독서 경험의 혁신을 이뤄냈다. 그리고 지금, 밀리의서재는 또 한 번의 혁신을 시도하고 있다. ‘AI서비스본부’를 신설하고 자사 플랫폼에 AI 기술 접목을 본격화한 것이다. 이에 테크42는 AI 격변이라는 파고에 맞서 정체성을 지켜가며 조용한 혁신을 시도하고 있는 밀리의서재가 나아갈 방향과 전략을 방은혜 AI 서비스본부장을 만나 직접 들어봤다.  

미국, 실리콘밸리서 중국 무인차 업체들에게 눈뜨고 코베이다

중국이 2025년까지 미국을 제치고 세계 최고가 되려는 기술에는 인공지능(AI), 반도체, 배터리, 그리고 자율주행차가 있다. 그런데 지난 수년간 미국 연방정부와 주정부가 중국 자율주행차 업체들에게 중요 정보유출을 당하는 줄도 모른 채 미국땅에서 자사 자율주행차를 마음껏 테스트하고 배워 갈 수 있도록 해 주었다는 지적과 경고가 나왔다. 중국과 기술전쟁중인 미국 연방정부와 주 정부가 중국 자율주행차 기술업체들에게 미국 땅에서 눈뜨고 코베이면서도 모른 채 방치했다는 얘기다.

최초의 ‘애플 AI 아이폰’ 주의해야 할 사항은 다음과 같습니다

애플이 AI 기반 기능을 지원하도록 설계된 칩 하드웨어가 장착된 아이폰 출시에 이어, 기업의 AI 도구 ‘애플 인텔리전스’를 공개했다. 애플은 소프트웨어 업데이트를 스마트폰이 ‘더욱 지능적’이라고 소개하고 있지만, 사용자들은 ‘있으니까 좋네’ 정도의 피드백을 할 가능성 크다는 지적이 나온다. 시리 업그레이드가 포함된 애플 AI 도구의 가장 큰 업데이트는 올해 말, 내년 초에 예정돼 있다.

파스칼 달로즈 다쏘시스템 CEO “현실과 가상세계를 연결하는 버추얼 트윈 플랫폼으로 생성형 경제 주도할 것”

파스칼 달로즈(Pascal Daloz) 다쏘시스템 최고경영자(CEO)는 인사말과 함께 한국 경제와 30년가까운 세월 동안 긴밀하게 연계·협력해 온 다쏘시스템의 연혁을 언급하며 말문을 열었다. 이날 파스칼 CEO는 다쏘시스템의 주요 사업 부문인 제조, 생명과학과 헬스케어, 인프라와 도시 부문 소개와 함께 '생성형 경제(Generative Economy)'에 대해 설명하며 지속적인 성장에 대한 인사이트를 이야기했다.