영화 ‘Her’ 같은 ‘고급 음성모드 챗GPT’ 사용하는 방법

[AI요약] 영화 ‘Her’에서 나오는 인공지능 비서와 같은 고급 음성모드를 이제 챗GPT를 통해 사용할수 있게 됐다. 기본적으로 챗GPT의 오디오 채팅에 고급 음성모드를 추가한 오픈AI의 새로운 챗봇은 사용자와 보다 자연스러운 대화는 물론 취침 전 이야기를 들려주거나 면접 준비를 돕거나, 심지어 외국어 실력을 향상시키는데 도움을 줄 수 있다.

고급 음성 모드 챗GPT는 기존 챗봇보다 훨씬 자연스러운 대화가 가능하다. (이미지=오픈AI)

영화 속 인공지능 같은 챗봇과 자연스럽게 대화할수 있는 고급 음성모드의 챗GPT가 드디어 대중에게 서비스를 시작한다.

고급 음성모드로 새롭게 업그레이드된 오픈AI의 ‘챗GPT’(ChatGPT) 기능과 사용법에 대해 테크크런치, CNBC 등 외신이 25일(현지시간) 보도했다.

오픈AI는 챗GPT 유료 사용자 확장 세트에 고급 음성 모드(AVM)를 출시한다고 24일 발표했다. 이는 기본적으로 챗GPT의 오디오 채팅에 AVM를 추가한 서비스다.

오픈AI는 이번에 새롭게 업그레이드된 챗GPT를 출시하면서 AVM의 디자인을 개편했다. 이에따라 앞서 오픈AI가 지난 5월 해당 기술을 처음 선보일 때 공개한 애니메이션 검은색 점 대신 파란색 애니메이션 구로 표시된다.

또한 AVM에는 △사용자 지정 지침 △메모리 △5가지 새로운 음성 △개선된 악센트가 추가됐다.

AVM 서비스는 일주일 동안 순차적으로 각 국가에 공개될 예정이나, 현재 유럽연합 국가, 아이슬란드, 리히텐슈타인, 노르웨이, 스위스, 영국 등 일부 국가에서는 사용이 불가능하다.

오픈AI가 새로운 AVM 기능을 최초 공개한 지난 5월 당시 2013년 영화 ‘Her’에서 스칼렛 요한슨의 목소리와 비슷한 스카이(Sky)라는 목소리 때문에 많은 논란과 함께 사실상 대대적인 홍보에 성공했다.

요한슨을 대리하는 법률 고문은 오픈AI에 서한을 보내 기업이 요한슨과 거의 동일한 목소리를 사용할 권리가 없다고 주장했으며, 오픈AI는 제품에서 해당 목소리를 사용하는 것을 중단한바 있다.

이후 무료버전 사용자들은 챗GPT를 통해 다른 음성으로 대화할수 있는 서비스를 이용했으며, 고급버전 사용자들은 더 빠르게 응답하고 사용자가 방해하면 말을 멈추고 듣는 챗봇 기능을 이용했다. 현재 선택할 수 있는 음성은 9개 있으며 앱 설정의 사용자 지정 부분에서 음성 채팅에 대한 지침을 입력할수 있다.

챗GPT와 보다 자연스럽게 대화할수 있도록 하는 오디오 기능은 챗GPT 플러스(Plus) 및 팀스(Teams) 사용자에게 먼저 공개된다. 엔터프라이즈(Enterprise) 및 에듀(Edu) 사용자는 그 다음주부터 액세스할수 있다. 가장 저렴한 옵션은 월 20달러(약 2만6646원)인 플러스 사용자다.

고급 음성 모드로 새롭게 업그레이드된 오픈AI의 ‘챗GPT’가 서비스를 시작한다. (이미지=링크드인)

챗GPT의 유료 AVM 기능은 오픈AI가 기기에 대한 액세스 권한을 부여했다고 가정하면 시작하기 쉽다. 먼저 휴대전화에 최신 버전의 앱이 있는지 확인하고 앱을 연다. 새로운 기능에 대한 액세스가 켜지면 앱에서 알림을 받게 되는데, 알림대로 계속 버튼을 눌러 시작할수 있다.

그런 다음 오른쪽으로 살짝 밀거나 왼쪽 상단 모서리에 있는 두 줄 아이콘을 탭하고 상단에서 챗GPT를 선택해 새 채팅을 만든다. 메시지 텍스트 필드와 마이크 아이콘 오른쪽에 음성 아이콘이 보이면, 이를 탭하고 사운드가 켜져 있는지 확인한다.

그러면 몇초 후에 작은 ‘쿵’ 소리가 들리고 화면 중앙의 원이 움직이는 하늘과 같은 파란색과 흰색 애니메이션으로 바뀐다. 이제 사용자가 말하기를 시작하면 챗봇은 이에 빠르게 응답한다. 오디오가 약간 끊어지는 경우가 있으니 놀라지 않아도 된다.

오픈AI에 따르면 새로운 AVM은 일부 외국어의 악센트를 개선하고 대화 속도를 높였다. 그리고 응답 내용이 마음에 들지 않으면 챗GPT에 다르게 말하도록 요청할 수 있다. 예를 들어 말하는 속도를 높이거나, 미국의 경우 남부 악센트를 사용하도록 요청할수 있다.

고급 음성 모드를 사용하면 챗GPT가 취침 전 이야기를 들려주거나 면접 준비를 돕거나, 심지어 외국어 실력을 향상시키는데 도움을 줄수 있다.

다만, 비용을 지불하더라도 유료 AVM에 무제한으로 액세스할수는 없다. 30분 정도 사용하면, 화면 하단에 ‘남은 시간 15분’이라는 문구가 표시된다. 오픈AI는 시간제한에 대한 세부 정보를 아직 공개하지 않았다.

챗GPT 고급 음성 모드 공개후 샘 알트먼 오픈AI CEO는 “기다린 보람이 있었으면 좋겠다”라고 X 게시물을 통해 밝혔다.

류정민 기자

znryu@daum.net
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

2025년 스타트업이 직면한 현실은 ’혹한기’넘어 ‘빙하기’…위기 속에 기회는?

2025년은 지난해에 이어 생성형 AI 기술 기반 스타트업이 지속적인 주목을 받을 것으로 전망되고 있다.단 전제 조건은 기술력도 중요 하지만 기술을 서비스에 접목해 ‘돈’을 만들어 내는 성과가 뒷받침 돼야 한다는 점이다. 그런 측면에서 생성형 AI 기술 기반 AI 에이전트 서비스가 특히 주목을 받고 있다. 또 그간 모바일, 노트북 기반 디지털 서비스로만 국한 됐던 AI 기술이 물리적인 현실세계에 적용되는 자율주행을 비롯해 휴머노이드(로봇)을 통한 공간지능으로 구현될 것이라는 기대감도 커지고 있다.

오순영 AI 미래포럼 공동의장 “2025년은 AI 대전환 시기", 한국이 집중해야 할 것은?

“최근 한 연구에 따르면 평균적인 인간과 AI 시스템을 붙여놨더니 잘하는 AI와 잘하는 인간보다 못한 결과가 나왔다고 합니다. 결국 AI 도입을 고려하는 기업은 내부 직원의 업스케일링(최신기술 교육)과 리스케일링(기존 전문가 대상 교육)을 챙겨야 한다는 거예요. AI 시대의 인재는 어느 한 가지를 잘 하는 사람은 아니죠. 특정 단위의 업무는 모두 AI로 대체될 테니까요. 그 보다는 환경과 조직을 폭넓게 이해하고 AI를 운용할 수 있는 사람이 필요하죠. 앞으로는 협력, 소통과 같은 소프트 스킬이 더 중요한 시대가 될 겁니다. 또 AI 서비스를 개발하는 기업에게는 사용성이 굉장히 중요하다고 다시 한 번 강조하고 싶어요.”

추락한 ‘인텔’과 뉴스타 ‘브로드컴’ 칩 공룡은 뭐가 달랐나

[AI요약] 인텔이 최악의 침체를 겪고 있는 가운데 브로드컴은 최고의 호황을 누리고 있다. 인텔과 브로드컴, 두 칩 제조업체의 변화하는 운명은 기술...

[CES2025] 3대 관전 포인트···AI·로봇·양자기술

세계최대 가전·정보기술(IT) 전시회인 라스베이거스가전쇼(CES 2025)가 7일부터 10일(현지시각)까지 나흘간 열린다. 올해 행사의 트렌트, 최대 관전(觀展)포인트, 인기를 끄는 제품들에 대해 알아본다. 아스테크니카, 벤처비트, 더버지, AFP, 씨넷 등 이 행사를 다룬 해외 주요 매체들이 주목한 트렌드와 제품들을 살펴봤다.