‘달리3·빙’ 품은 ‘챗GPT’, 이런 능력까지 있는줄 몰랐죠?

[AI요약] 챗GPT가 우여곡절 끝에 마침내 인터넷 검색엔진 빙을 최종적으로 추가했다. 오픈AI는 몇달간의 공백 끝에 달리3를 베타 버전으로 다시 도입하고, 이후 공식적으로 인터넷 탐색 기능도 제공하기 시작했다. 달리3와 빙을 품은 챗GPT는 이제 한층 더 똑똑해졌다.

오픈AI는 최신 텍스트-이미지 생성기를 선보인지 한달 만에 달리3를 베타 버전으로 전환했다. (이미지=오픈AI)

달리3(DALL-E 3)와의 통합, 빙(Bing) 검색 재출시 그리고 멀티모달 기능 추가까지, 새롭게 업그레이드된 오픈AI(OpenAI)의 생성형 인공지능(AI) 챗봇 ‘챗GPT’(ChatGPT)에 대해 뉴욕타임즈, 더버지 등 외신이 25일(현지시간) 보도했다.

달리3를 통합한 챗GPT가 베타 버전으로 최근 출시됨에 따라, 공식적으로 웹 검색 기능인 빙 검색을 제공한다. 오픈AI는 몇달간의 공백 끝에 달리3를 베타 버전으로 다시 도입한 지 약 3주만에 공식적으로 챗GPT에 인터넷 탐색 기능을 출시했다.

지난 1년 동안 세계를 강타한 챗GPT의 데이터는 2021년 9월까지의 데이터로 제한돼 실시간 검색 엔진으로서 쓸모가 없게 됐었다.

이후 오픈AI는 3월부터 챗GPT에 인터넷 서비스를 제공하기 시작했으며, 이는 라이브 웹이 기존 교육 데이터 세트와 동일한 방식으로 관리되지 않는다는 점을 감안할때 내재된 위험이 수반되는 조치였다. 실제로 이로인해 악의적인 사용자와 구식 알고리즘 혼란에 의한 악용과 남용의 사례가 지적됐다.

오픈AI는 5월부터 후원 기업인 마이크로소프트(MS)에 속한 검색 엔진인 빙을 통해 웹 검색을 출시하기 시작했으며, 6월 말에는 챗GPT 모바일 앱에 대한 액세스를 확장했다. 그러나 챗GPT가 페이월 콘텐츠를 표시할수 있다는 사실이 밝혀진 후 인터넷 검색 엔진 서비스가 신속하게 삭제된 것이다.

9월 말이 되자 오픈AI는 챗GPT가 콘텐츠 소유자가 정한 지침을 따르는 방식을 미세 조정하면서 빙 검색 기능을 다시 제공하기 시작했다. 본질적으로 오픈AI는 이제 기존 웹 크롤러와 유사하게, 검색로봇에 사이트 및 웹페이지를 수집할수 있도록 허용하거나 제한하는 국제 권고안인 ‘Robots.txt 파일’을 모두 준수하게 된다.

로봇배제표준(robots exclusion standard) 또는 로봇배제프로토콜(robots exclusion protocol)은 웹 사이트에 로봇이 접근하는 것을 방지하기 위한 규약으로, 일반적으로 접근 제한에 대한 설명을 ‘Robots.txt’에 기술하고 있다.

따라서 이제 모든 챗GPT 플라스 및 엔터프라이즈 구독자는 설정에서 베타 스위치를 전환할 필요 없이 빙 검색을 공식적으로 사용할수 있다.

달리3가 챗GPT에 직접 내장돼 있어 사용자는 앱을 전환하지 않고도 해당 기능을 활용할수 있다. (이미지=오픈AI)

특히 오픈AI는 최신 텍스트-이미지 생성기를 선보인지 한달 만에 달리3를 베타 버전으로 전환했다. 챗GPT와 통합된 달리3로 인해 사용자가 달리3에 이미지 생성을 요청할때 텍스트 프롬프트에 대해 너무 신중하게 생각할 필요가 없게 됐다. 챗GPT는 이미지 생성에 필요한 ‘많고 무거운’ 작업을 수행할수 있기 때문이다.

무엇보다 달리3가 챗GPT에 직접 내장돼 있으므로, 사용자는 이제 앱을 전환하지 않고도 텍스트 기반 쿼리의 일부로 이미지를 수신할수 있다. 예를들어 사용자는 챗GPT의 도움을 받아 ‘산에 있는 산채비빔밥 식당’의 로고를 만들기 위해 기존처럼 자세한 프롬프트를 제시할 필요가 없게된 것이다.

2021년 1월에 처음 출시된 달리는 스태빌리티AI(Stability AI) 및 미드저니(Midjourney) 등 다른 텍스트-이미지 생성 AI 아트 플랫폼보다 먼저 출시됐다. 2022년 달리2가 출시될 때까지 오픈AI는 달리가 노골적인 이미지를 생성할수 있고 사진 생성 시 편견을 보였다는 비판을 받은 후 플랫폼을 사용할 사람을 제어하기 위해 대기자 명단을 개설하기도 했다. 이후 기업은 지난해 9월 대기자 명단을 없애고 달리2를 대중에게 공개했다.

가장 최신 버전인 달리3는 현재 챗GPT 플러스 및 엔터프라이즈 구독자를 통해 공개되고 있으며, 오픈AI는 무료 공개 버전이 언제 출시될지는 밝히지 않았다. 사용자는 챗GPT 내부의 GPT-4 탭에서 ‘DALL-E 3(베타)’를 선택해 기능을 활성화할 수 있다.

이에 앞서 오픈AI는 챗GPT가 ‘보고 말할수’ 있는 이미지 인식이 가능한 멀티모달 기능을 추가하면서 크게 주목받았다. 예를들어 사용자는 챗GPT에 ‘내가 발견한 이 물건은 뭐지?’라고 사진찍어 보여주면 챗봇은 이를 분석하고 해당 물체에 대한 답변을 해주는 식이다. 챗봇에게 냉장고에 있는 식재료를 찍어 보여주면 재료를 활용한 레시피를 조언 받을수도 있다.

가브리엘 고 오픈AI 연구원 “달리3는 여러 단락으로 구성된 설명에서 이미지를 생성하고 세밀하게 설명된 지침을 밀접하게 따를수 있다”며 “그와 동시에 모든 이미지 생성기 및 기타 AI와 마찬가지로 시스템적인 실수가 발생하기 쉽다”고 달리3 시연을 통해 설명했다.

산디니 아가르왈 오픈AI 연구원은 “달리3는 사실적이기보다는 더 양식화된 이미지를 생성하는 경향이 있다”며 “그러나 모델이 보안 카메라에 포착된 이미지 유형과 같은 거친 이미지를 생성할 가능성도 있다”고 덧붙였다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

[마루에서 만난 사람] 김연석 제틱에이아이 대표 “AI 기업을 위한 원스톱 온디바이스 AI 전환 솔루션을 만들고 있습니다”

멜란지는 현재 베타 버전 단계에서도 전 세계에 보급된 모바일 NPU의 80%에 적용 가능한 수준이다. 향후에는 아직 지원되지 않은 나머지 20%를 채워 나가는 것이 목표다. 궁극에는 NPU가 적용된 세상의 모든 기기에서 동작하는 온디바이스 AI 서비스를 지원하겠다는 것이다. 김 대표는 그 시점을 언급하며 ‘공존하는 생태계’에 대한 구상을 털어놨다.

‘로보택시 Vs. 자차 자율주행’ 미래 교통의 승자는?

자율주행차 업계가 숨가쁘게 돌아가고 있다. GM이 그동안 투자했던 자율주행 로보택시 기업 크루즈에 대한 투자를 전면 중단한 가운데, 구글 모기업 알파벳의 로보택시 자회사 웨이모는 오히려 사업을 확대하고 있다. 우버는 기존 자율주행차 제조업체에서 유통업체를 전략을 바꾸면서 새로운 시장을 개척하고 있다. 애플은 10년 공들인 자율주행차 사업 포기를 결정했으며 테슬라는 해당 사업을 확대하고 있다.

[마루에서 만난 사람] 문창훈 파워테스크 대표 “어떤 프로세스, 데이터라도 연동할 수 있는 기업용 업무 자동화 플랫폼을 만들었습니다”

문 대표와 파워테스크 팀이 각고의 노력을 거듭해 선보인 ‘아웃코드’는 개발인력이 부족한 중소 스타트업, 중견기업이 맞춤형 업무 자동화 솔루션을 개발할 수 있도록 도와주는 플랫폼이다. 구글시트, 엑셀, 노션 등 이미 기업들이 업무에 사용하고 있는 솔루션의 모든 데이터를 각각의 워크플로우에 자동으로 연동되도록 한 것이 특징이다. 노코드인 만큼 직관적인 환경에서 마우스 클릭만으로 각 회사의 업무 환경에 맞춘 최적화 솔루션을 만들 수 있다.

‘X는 X’ 일론 머스크의 ‘디지털 타운스퀘어’를 탈출하라

언론인, 스포츠클럽, 영화감독과 배우 등 사회 각층 저명한 인사들이 사용자들의 X 이탈 추세에 합류하고 있다. 사용자들은 일론 머스크가 트위터를 인수한 후 X 내에서 인종차별, 동성애 혐오, 반유대주의 등 증오 표현이 증가하고 도덕적 가치가 훼손되고 있다고 비판하고 있다.