클로바는 시각장애인에게 더 빠르게 말해도 될까?

"Nobody Speaks that Fast!" An Empirical Study of Speech Rate in Conversational Agents for People with Vision Impairments, CHI '20: Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, 2020을 개인적인 공부를 위해 정리한 글로 원문과 내용상 차이가 있을 수 있습니다

기술의 혜택을 누구나 공평하게 누리진 못합니다. 스마트폰은 전화나 문자 외에도 일상생활에 꼭 필요한 기능을 대부분 수행할 수 있게 해줍니다. 그러나 스마트폰의 멋진 기능들을 누구나 누릴 수 있는 건 아닙니다. '기술 접근성'이 떨어지는 시각장애인 사용자층은 더욱 그러합니다. 음성 입력 기능이 나오기 이전에 시각장애인들은 스스로 문자를 보내거나 전화를 거는 일 조차 쉽지 않았습니다. 이제는 스마트폰이 너무나 많은 것을 하기 때문에 제대로 쓸 수 없다면 개인이 자신의 삶을 독립적으로 유지할 수 없을 정도입니다.

다행히 빅스비, 시리와 같은 대화형 에이전트는 시각장애인에 대한 기술 접근도를 높여주고 있습니다. 간단한 명령어로 앱의 기능을 실행하는데 걸리는 시간을 단축하고, 좀 더 쉽게 콘텐츠를 읽어 들임으로써 그들을 돕고 있습니다. 특히 에이전트의 말하기 속도는 그들의 경험에 많은 영향을 미칩니다.

일반적으로, 시각장애인들은 대화형 에이전트를 보조적인 수단을 사용하는 사람들과 달리 모든 콘텐츠를 듣고 말하기를 통해 활용해야 합니다. 따라서 느린 말하기 속도를 유지한다면 그들은 전체 콘텐츠를 탐색하는데 답답함을 느낍니다. 기존의 컴퓨터나 스크린 리더를 통한 Voice-over를 사용하는 시각장애인은 보통의 속도보다 빠르게 설정해서 듣는 편입니다.

빅스비가 제공하는 장면 설명 기능

20일간의 시각장애인의 대화형 에이전트 사용 경험 관찰

그러나 빅스비, 시리와 같은 에이전트의 경우에 어떠한 빠르기로 말해야 하는지에 대한 제대로 된 탐색은 없었습니다. 그들은 정말로 빠르게 말하는 에이전트를 원할까요? 연구진은 이에 대한 답을 얻기 위해 10명의 시각장애인에게 스마트 스피커를 제공하고 20일 동안 그들의 사용을 관찰을 했습니다.

참가자의 클로바 사용 순서. 처음 열흘은 빠르게(혹은 느리게) 나머지 열흘은 반대의 속도를 쓰도록 하였다.

실험에 참가한 시각장애인들에게는 서로 다른 두 가지 발화 속도를 가진 네이버 클로바가 제공되었습니다. 그들은 총 20일의 사용기간 중 절반은 빠른 속도로, 절반은 보통 속도로 말하는 클로바를 사용하였습니다. 제공된 클로바의 보통 빠르기 속도는 4.72음절을 1초에 말하게 했습니다. 이 속도는 한국인 평균인 4.82 음절을 고려하여 비슷하게 설정되었습니다. 빠른 속도로는 7.22음절/초를 사용했습니다. 평소에 들었다면 어색할 정도지만 집중한다면 무리 없이 내용을 알아들 수 있는 정도의 빠르기입니다.

참가자들은 사용 중에 주기적으로 그들의 만족도, 편리함, 유용함을 속도에 따라 평가했으며, 연구진은 인터뷰 결과의 정성분석을 포함해 에이전트의 말 빠르기에 따른 사용자 경험을 분석하였습니다.

만족도

놀랍게도, 일반적인 그들이 보통 빠른 속도로 스크린리더를 사용함에도 불구하고 전반적인 만족도, 친밀감, 편리함에 있어 보통의 빠르기로 말하는 클로바를 더 선호하는 것으로 나타났습니다. 특히 친밀감에 있어서는, 평범한 말의 속도를 더 선호하는 것이 자연스럽게 여겼습니다. 10명 중 7명의 참가자는 기본 속도를 더 친밀하게 느꼈으며, 3명은 속도와 상관없이 비슷하다고 응답했습니다. 기대와는 다르게 기본 속도를 선호는 데 이유가 있었습니다.

첫 번째는 핸드폰과 달리 사용자와 스마트 스피커의 경우 사용자와 거리가 꽤 있기 때문입니다. 똑같이 빠른 속도로 말하더라도, 열린 공간에서는 정확하게 발음을 알아듣기가 힘듭니다. 두 번째로, 스피커를 가족과 함께 사용하는 경우에 자신은 스피커의 말을 알아듣더라도 다른 구성원이 빠른 발음에 적응하기 어렵습니다. 일부 참가자는 빠른 속도에 적응하기도 했지만, 그들은 대부분 기존의 스크린리더를 사용할 때에도 아주 빠른 속도로 사용하는 것에 익숙했습니다.

사용 패턴

참가자들의 명령어 종류별 사용 빈도. 위에가 기본 속도, 아래가 빠른 속도이다.

에이전트의 발화 속도에 따라 사용 패턴의 변화를 추적하였으나 둘 사이에 큰 차이는 없었습니다. 일반적으로 두 그룹 모두 노래 재생, 알람, 날씨, 정보 검색 등의 명령어 위주로 사용하였습니다. 그럼에도 약간의 차이가 있다면 전체 명령어 수는 빠른 발화 속도를 사용할 때(632개)가 그렇지 않을 때보다(605개) 약간 더 많았습니다. 또한 기본 발화 속도를 사용할 때(111개)는 빠른 속도를 사용할 때(104개)보다 좀 더 잡담 기능을 자주 썼습니다. 보통 사람처럼 말할 때는 친근하게 일상적인 대화를 나누기에 편리하고, 정보를 요청할 때는 빠른 속도로 필요한 정보만 가져가기가 편리하기 때문입니다.

사용자 인식과 기대

koreabizwire, 2019

사용자들은 보통의 속도로 말하는 클로바에게 좀 더 의인화된 특징을 느끼고 감정적 유대감을 느끼는 것 같았습니다. 그들은 에이전트가 단순한 기계가 아니라 친구나, 전문 비서 여자로 여깁니다. 물론 단순히 소통을 위한 기계만으로 여기기도 하지만, 일부는 강아지보다 더 나은 존재라고 생각하기도 했습니다.

반면에, 빠른 말하기 속도의 클로바는 확실히 그저 기계라는 인식이 강합니다. 빠르게 문장을 읽어 내려가는 클로바는 좀 더 딱딱하고, 사용자와 연결이 끊긴 느낌을 줍니다. 소위 '다다다다다-' 말하는 방식은 인간적인 매력을 느끼기에는 다소 실망감을 주는 것입니다. 물론 모든 사용자가 그렇게 느끼는 것은 아닙니다. 한 참가자는 재잘거리는 자매 같은 느낌을 받았다고 합니다. 그 참가자는 보통 속도의 클로바는 침착한 언니처럼 느꼈다고 합니다.

실험에 참여한 시각장애인들은 클로바가 빠르게 말하든 느리게 말하든 감정적인 교류를 주고받으며 친근함을 느끼길 기대했습니다. 기존의 스크린리더가 단순히 정보를 음성으로 전달하는 도구였다면, 클로바는 양방향으로 소통 가능한 존재라고 인식을 한 것입니다.

발화 속도의 조절

실험에는 빠른 속도와 보통 속도 두 가지 종류의 발화 속도를 제공했으나, 시각장애인들에게는 더 세밀한 수준의 속도 조절이 필요한 것 같습니다. 참가자 10명 중 9명은 그들의 에이전트가 말하는 속도를 조절할 수 있는 기능이 있어야 한다고 말했습니다. 한 참가자는 15단계로 조절되는 다른 스크린리더의 예시를 말하면서 클로바나 다른 에이전트 또한 개인차에 따라 발화 속도를 예민하게 조정하고 싶다고 이야기했습니다.

그들은 에이전트를 사용하는 맥락에 따라 다른 발화 속도가 필요하다고 이야기했습니다. 예를 들어 아침에 급하게 나가면서 날씨를 물어볼 때는, 영화 정보를 찾아볼 때는 빠르게 말해주기를 원했고, 일상적인 대화나 감정 교류를 할 때는 약간 느린 발화 속도를 원했습니다. 그들이 사용하는 스크린리더 제품에 비해 아직 대화형 에이전트는 그들을 위한 발화 속도 조절 기능이 충분히 제공하질 않습니다.

에이전트의 발화 속도와 시각장애인을 위한 디자인

https://www.aboutamazon.com/news/devices/alexa-speak-slower

그간 산업계와 학계 모두 효율적인 에이전트 활용을 위한 가이드라인을 제작하는데 많은 노력을 쏟은 것은 사실입니다. 그러나 새로운 기술을 빠르게 전달받지 못하는 소외계층에게 아직은 관심이 별로 없는 것이 현실입니다. 정확하게는, 어느 정도 관심은 있지만 그들을 충분히 만족시켜줄 만큼 학술적, 기술적 기반을 다지지는 못한 것이지요. 시각장애인을 위한 에이전트는 테스크를 빠르게 수행하는 능력뿐 아니라 대화 속도가 문맥에 따라 다르게 제공되어야 하며, 에이전트가 사용자가 원하는 종류의 관계를 맺을 수 있도록 디자인되어야 합니다. 다행히 아마존 알렉사가 "Alexa, speak slower" 같은 개인 맞춤형 기능을 출시하는 등 각계의 노력이 시작되는 듯합니다. 새로운 기술의 혜택을 누구나 누릴 수 있도록 조금 더 관심을 기울여햐 할 때입니다.

본 글의 원문은 이곳에서 볼 수 있습니다 (클릭)

  • KRAFTON 디자이너 바다김님은 KAIST에서 디자인과 전산학을 공부했습니다.
  • 지금은 UX 디자이너로 공부하며 글쓰고 수다떨며 살고 있습니다.

바다김

jyee5001@gmail.com
기자의 다른 기사보기
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지

관련 기사

모르면 곤란한 10월의 트렌드, 좀 더 똑똑하게 보려면?

🧐 우리나라는 정년이 언제더라… 여러분은 ‘은퇴 후 계획’ 세우셨나요? 저는 은퇴라는 주제를 떠올리면 퇴직 후 어떤 삶을 살아가게 될지, 그리고 노후 자금은 얼마나...

M4 프로세서와 맥이 꽤 괜찮은 게임기인 이유

M4 맥스의 발표와 함께 CDPR이 사이버펑크2077을 맥으로 내놓겠다고 밝혔습니다. 맥으로 AAA 급 게임들이 꽤 많이 나오고 있죠. 맥으로 게임하는 것이...

생성 AI 시대, 공짜는 없죠

생성형 인공지능, 온디바이스 AI 그리고 애플 인텔리전스라고 불리는 이 시대의 인공지능 모델은 평생 무한대로 쓸 수 있을까요? 사실 인공지능에 투자하는 비용은 우리가 상상할 수 없을 정도로 막대한 편입니다. GPU나 서버에 들어가는 인프라 비용에 인공지능 모델을 개발하는 비용과 인건비, 전력비, 인공지능 학습을 위한 수많은 형태의 콘텐츠 수급비용까지 어마어마한 비용이 들겠죠.

'M4 프로' 칩으로 더 완벽해진 맥 미니

애플은 오늘 신형 맥 미니를 공개하며 크기를 줄이고 성능을 강화한 M4 및 M4 Pro 프로세서를 탑재한 것이 핵심이라고 밝혔습니다. 이번...