어느덧 완연한 가을이 찾아왔습니다. 얼마 전까지만 해도 반팔을 꺼내 입었는데, 이제는 외투가 필요할 정도로 날이 많이 추워졌어요. 그래서 저는 지난 주말, 더 이상 미룰 수 없다는 생각에 옷장 정리를 마쳤는데요! 옷장 깊숙한 곳을 정리하던 중 어릴 적 피아노 학원에서 색칠하던 진도 카드를 발견했습니다.
데이터 시각화 회사에 다니면 직업병이 생깁니다. 무엇을 보더라도 ‘이거 혹시 데이터 시각화…?’ 라는 생각이 드는데요. 진도 카드의 색칠된 그림 한 개가 연습 1회를 의미하는 것을 보고 이것 역시 시각화의 일종이 아닐까라는 생각이 문득 들었어요. 색칠된 그림의 개수로 곡별 연습량을 알 수 있기 때문이죠!
요즘 자주 사용하는 물건 중에서도 비슷한 사례를 발견했습니다. 바로, 매일 그날의 목표를 달성하면 스티커를 붙이는 스티커판이에요. 이것 역시 스티커 한 개가 1회의 목표 달성을 의미합니다. 또, 전체적으로 보면 월별 목표 달성 비율을 알 수도 있고요.
‘이거 어디서 많이 본 시각화인데…!’ 하며 곰곰이 생각해 보니, 시각화 유형 중 ‘유닛 차트’가 떠올랐습니다. 유닛 차트는 귀여운 아이콘들이 줄지은 모양새를 보고 데이터를 해석하는 차트인데요! 일상생활에서까지 종종 발견될 정도로 쉽고, 재미있게 활용할 수 있는 차트란 생각이 들어 여러분에게도 소개해 드리고 싶었습니다. 모양은 익숙하지만 시각화 유형이라고는 인지하지 못했던 유닛 차트, 함께 알아볼까요?
우리가 아는 대부분의 시각화 차트에서는 여러 개의 데이터를 한 조각으로 요약해서 표현합니다. 예를 들어 막대 차트는 막대 조각으로 데이터를 계산한 값을 표현하는데요. ‘유닛 차트(Unit chart)’는 데이터를 하나씩 쪼개서 여러 개의 ‘기호’로 표현하는 차트입니다. 데이터가 10이면, 기호도 10개로 표현하는 거죠!
유닛 차트의 ‘기호’ 표현 방법을 다른 차트와 비교해 보겠습니다. 위 그림을 보면, 왼쪽의 막대 차트는 세 개의 막대가 항목별로 데이터의 총합을 표현하고 있습니다. 반면 오른쪽의 유닛 차트는 작은 사각형 기호들이 하나, 하나의 데이터를 표현하고 있어요. 막대 차트는 막대 조각의 길이로 데이터의 크기를 비교하지만, 유닛 차트는 데이터를 개별 기호의 개수로 데이터의 크기를 비교할 수 있습니다. 막대 차트 못지않게 차트가 직관적이어서 쉽게 해석할 수 있다는 장점이 있어요!
한편, 유닛 차트의 ‘유닛(unit)’은 ‘단위’를 의미하는데요. 유닛 차트에서의 ‘단위’란 기호 하나가 의미하는 데이터의 크기를 뜻합니다. 단위는 데이터값의 크기에 따라 다양하게 설정할 수 있는데요. 기호 하나당 데이터 1개를 표현할 수도 있고, 데이터 10개를 표현할 수도 있습니다.
기호가 어떤 단위를 가질 수 있는지 사례로 알아볼까요? 위 그림은 나라별로 1인당 평일 맥주 소비량을 나타낸 유닛 차트입니다. 나라별 맥주 소비량을 한 사람이 평일에 마시는 양으로 환산한 데이터를 시각화했는데요. 위 사례에서 기호 한 개는 맥주 500ml 한 잔을 의미합니다.
가장 상단의 체코는 기호가 총 다섯 개로, 1인당 평일 맥주 소비량이 5잔이라는 것을 알 수 있습니다. 반면 가장 하단의 필리핀은 0.4잔으로, 맥주잔의 40%만이 노랗게 색칠되었어요. 맥주잔에 맥주가 담긴 양을 통해 소수점까지 표현했습니다. 맥주 소비량을 맥주잔에 담긴 맥주의 양으로 볼 수 있으니, 더욱 직관적으로 데이터를 해석할 수 있어요.
유닛 차트가 재미있는 이유는, 맥주 소비량을 맥주잔으로 표현한 위 사례처럼 데이터의 특성을 반영할 수 있기 때문입니다. 대부분의 시각화 유형에서는 데이터를 표현하는 요소가 고정되어 있는데요. 유닛 차트에서는 데이터를 도형, 아이콘, 이미지 등 다양한 모양의 기호로 표현할 수 있어요!
지금까지 유닛 차트가 무엇이고, 어떤 특징을 가졌는지 알아보았습니다. 유닛 차트는 항목별로 그림만 몇 개 그리면 완성되니, 누구나 활용해 볼 법한 쉬운 차트였어요. 하지만 조금의 ‘디테일’을 챙긴다면 유닛 차트를 더욱 유용하게 활용할 수 있는데요. 여러분의 원활한 유닛 차트 활용을 위해, 디테일을 녹인 3가지 활용 방법을 정리해 보았습니다! 사례와 함께 알아볼까요?
앞서 이야기했던 것처럼, 유닛 차트는 시각화에 조예가 깊지 않더라도 그림을 보고 쉽게 데이터를 파악할 수 있다는 장점을 가졌습니다. 마치 어렸을 적 숫자를 배울 때 그림의 개수로 숫자를 이해했던 것처럼 말이죠! 그런데, 그림의 크기가 항목마다 제각각이라면 어떨까요?
위 두 개의 그림은 모두 유닛 차트입니다. 간식 인기투표 결과를 나타낸 것인데요! 왼쪽 유닛 차트를 보면 프렛즐(Pretzels)을 좋아하는 사람이 두 번째로 많아 보입니다. 하지만, 오른쪽의 유닛 차트를 보면 프렛즐이 가장 적은 투표수를 받은 것을 알 수 있는데요. 이렇게 해석의 차이가 생기는 이유가 무엇일까요?
왼쪽의 유닛 차트는 기호마다의 크기가 다르고, 오른쪽은 기호의 크기가 모두 같기 때문입니다. 유닛 차트에서는 ‘기호’가 데이터를 표현하는 수단이므로 크기 설정에 주의해야 하는데요! 기호의 크기가 저마다 다르면 해석에 혼란을 줄 수 있으니, 항목별 데이터를 비교할 때는 반드시 기호의 크기를 동일하게 설정해야 합니다. 그림의 오른쪽 차트처럼요!
앞서 유닛 차트를 설명할 때, 유닛 차트의 각 기호는 1을 표현할 수도 있고, 10을 표현할 수도 있다고 언급했습니다. 데이터에 따라서는 기호 하나당 10만, 100만 등 아주 큰 숫자를 의미할 수도 있죠! 그렇기 때문에, 기호의 단위가 1이 아닐 때는 반드시 기호의 단위를 표시해 주어야 읽는 사람의 이해를 도울 수 있습니다. 범례를 적절하게 활용한 사례들을 한번 살펴볼까요?
위 시각화는 2015년 우리나라의 우울증 진료 인원을 성별, 연령별로 나타낸 유닛 차트입니다. 중앙의 연령대 축을 기준으로 왼쪽에는 남성, 오른쪽에는 여성의 우울증 진료 인원을 원의 개수로 표현했어요.
그런데, 원의 개수를 세어 보니 많게는 열 개, 적게는 한두 개뿐입니다. 전국의 우울증 진료 인원수가 한두 명일 리가 없는데 말이죠…! 이때, 차트 오른쪽 상단의 범례를 참고해 보겠습니다. 범례를 보면 원 한 개당 5,000명을 뜻한다는 사실을 알 수 있는데요. 범례를 참고해서 다시 차트를 해석해 볼까요?
차트 오른쪽의 ‘여성’ 데이터 중, 원의 개수가 가장 많은 55~59세 여성의 데이터를 살펴보겠습니다. 원의 개수는 총 10개로, 범례를 참고하면 10에 5,000을 곱해 약 5만 명의 55~59세 여성이 우울증으로 진료를 받는다고 해석할 수 있습니다. 차트 항목 중 가장 높은 수의 진료 인원을 기록했는데요. 위 사례에서는 원을 노란색으로 칠하고, 원 옆에 ‘48,706명’이라는 설명을 추가해서 해당 항목이 가장 높다는 것을 강조하기도 했습니다.
범례가 아닌 ‘축’으로 단위를 표현하는 경우도 있는데요! 위 사례는 대만의 연도별 어린이 인구수와 반려동물 수를 나타낸 유닛 차트입니다. 어린이 인구란 14살 이하의 인구를 말하며, 반려동물은 반려견과 반려묘를 뜻하는데요. 위 사례는 대만의 총 어린이 인구수와 반려동물 수를 나타낸 것이니, 기호 한 개가 사람 한 명, 혹은 반려견 한 마리를 의미한다고 해석하기에는 무리가 있죠!
이때 사례 이미지 왼쪽의 y축을 보면, 1M, 2M 등의 단위가 표시된 것을 확인할 수 있습니다. 축의 레이블로 기호의 단위를 표시해 주었어요! ‘1M’는 1 million, 즉 백만(1,000,000)을 의미하는데요. 사례에서는 1M당 열 개의 기호가 사용되었기 때문에 기호 한 개당 어린이 십만 명, 혹은 반려동물 십만 마리를 뜻합니다.
축의 도움을 받아 차트를 해석해 볼까요? 먼저 가장 왼쪽의 2011년을 보면, 동물 얼굴 모양의 기호는 총 19개로 약 190만 마리인 것을 알 수 있습니다. 어린이 얼굴 모양의 기호는 총 35개로 350만 명인데요. 가장 오른쪽의 2021년을 보면 동물 얼굴 모양의 기호는 무려 30개로 300만 마리고, 어린이 얼굴 모양 기호는 28개로 280만 명을 나타내고 있습니다. 2011년에 비해 2021년의 반려동물 수는 약 두 배나 증가한 반면 어린이 인구는 70만 명이나 감소했어요. 이 차트는 대만의 급속한 저출산 현상을 보여주기 위해 제작되었는데요. 이렇게 직관적인 차트로 확인하니, 그 심각성이 훨씬 와닿는 듯합니다.
위 사례에서는 어린이 인구수 표현에 어린이 얼굴 모양 기호, 반려동물 수 표현에 강아지, 고양이 얼굴 모양 기호를 사용했는데요! 데이터의 특성을 차트에 반영해서, 별다른 설명이 없이도 각 기호가 어떤 데이터를 표현했는지 쉽게 이해할 수 있다는 유닛 차트의 장점이 잘 드러납니다. 또, 단순한 기호가 언어나 문화의 차이를 극복하는 데 도움이 될 수도 있을 것 같아요. 위 사례가 대만의 데이터를 표현했음에도 불구하고, 쉬운 기호로 단번에 전하고자 하는 메시지를 이해할 수 있었기 때문입니다.
지금까지 살펴본 유닛 차트는 항목별 데이터를 비교하는 용도로 활용되었는데요! 유닛 차트는 항목별로 전체 데이터 100% 중 몇 퍼센트의 비율을 차지하는지, 즉 ‘비중’을 표현할 때도 활용할 수 있습니다. 이때는 주로 기호를 사각형 모양으로 정렬하고, 데이터의 크기에 따라 일부분을 색칠하거나 강조하는데요! 격자무늬의 사각형을 전체 데이터로 보고, 항목별 데이터 크기에 따라 셀을 다르게 색칠하는 와플 차트와 유사한 형태로 볼 수도 있습니다. 사례를 통해 자세히 알아볼까요?
위 사례는 2009년 기준 미국이 세계 얼마나 높은 총기 보유율을 가졌는지 보여주는 유닛 차트인데요! 왼쪽은 전 세계 인구 중 미국 인구의 비율, 오른쪽은 전 세계 민간 소유 총기 중 미국의 민간 소유 총기 비율을 표현하고 있습니다. 왼쪽의 차트는 ‘인구’ 비율과 관련된 사람 모양 기호, 오른쪽의 차트는 ‘총기’ 비율과 관련된 총 모양 기호가 사용되었어요.
두 차트는 공통적으로 100개의 기호가 사각형 모양을 띠도록 정렬되었는데요. 총 100개의 기호는 100%를 의미하고, 하나의 기호는 100% 중 1%를 의미합니다. 항목별 비율에 따라 정렬된 기호 중 일부를 다른 색으로 강조했어요. 왼쪽의 전 세계 인구 중 미국인의 비율은 4.43%로, 사람 모양의 기호 100개 중 4.43개가 빨간색으로 표현되었습니다. 오른쪽의 전 세계 총기 보유 민간인 중 미국인의 비율은 42%로, 총 모양 기호 100개 중 42개가 빨간색으로 강조되었어요.
두 차트를 종합해 해석해 볼까요? 2009년 미국의 인구는 전 세계 약 70억 인구 중 4.43%에 불과한 3억 700만 명인데요. 미국의 민간인이 보유한 총기는 전 세계 총기 수 6억 5천만 개 중 무려 42%, 3억 개가 넘는 숫자입니다. 그야말로 어마어마한 수의 총기를 보유하고 있음을 알 수 있죠!
지금까지 유닛 차트가 무엇인지부터, 유닛 차트를 똑똑하게 활용할 수 있는 방법 3가지까지 알아보았는데요! 여러분, 이제는 유닛 차트에 대해 조금은 익숙해지셨을까요?
저는 개인적으로 유닛 차트의 활용 사례를 찾아보는 것을 굉장히 좋아합니다. 유닛 차트는 다른 차트보다 데이터의 특성을 더욱 개성 있게 드러낼 수 있기 때문이에요. 오늘 소개해 드린 사례들에서도 맥주잔 모양 기호, 얼굴 모양 기호 등 다양한 기호가 사용되었죠! 시각화 차트 유형 중에서도 특히나 보는 재미가 있는 차트랍니다. 그래서 이번 글을 준비하는 것이 참 즐거웠어요!
한편, 준비하는 과정에서 유닛 차트가 생각보다 ‘섬세한’ 차트라고 느껴지기도 했습니다. 기호만 대충 욱여넣는 것이 아니라 크기를 일정하게 설정해야 하고, 기호를 설명하는 범례나 축을 놓치지 않고 그려 넣어야 했죠. 사용자가 데이터를 쉽게 이해할 수 있도록 적절한 기호를 선택하는 것 역시 중요하고요! 그래서 더욱 ‘디테일’이 중요하다는 생각이 들었습니다.
일상에서 발견하기 쉽지만, 잘 알지는 못했던 유닛 차트! 오늘의 글을 참고해서 여러분도 유닛 차트를 활용해 보시는 건 어떨까요?