일상에서 수집한 데이터 시각화 사례 모음
현대 사회는 ‘데이터 시대’라고 부를 만큼 데이터가 산업과 경제 전반에 걸쳐서 큰 영향을 끼치고 있습니다. 자연스럽게 ‘데이터’는 이제 모두에게 너무나 익숙한 개념이 되었는데요! 저는 아무리 데이터가 익숙해졌다고 해도 개개인과는 거리가 있어 보였습니다. 기업, 공공기관, 연구 기관 등에서만 공적으로 데이터를 수집해 활용한다고 생각했기 때문이에요.
하지만, 사실은 우리의 일상에서도 충분히 데이터를 수집할 수 있습니다. 기상 알람을 맞춰 놓는 시간, 일하기 전 세우는 업무 계획 등의 기록을 모아 데이터로써 활용할 수 있는데요. 그렇다면 데이터 속에서 의미를 찾는 데이터 활용 방법인 시각화를 통해 우리의 평범하고 당연한 일상에서도 의미를 찾을 수 있지 않을까요?
온라인 데이터 시각화 플랫폼 ‘태블로 퍼블릭(Tableau Public)’ 웹사이트에서는 데이터 시각화 툴인 ‘태블로(Tableau)’의 사용자들이 제작한 데이터 시각화 대시보드를 탐색할 수 있습니다. 웹사이트에는 공공 데이터뿐만 아니라 개인이 수집할 수 있는 데이터로 제작한 대시보드도 다수 게시되어 있는데요! 오늘은 그중에서도 연간 목표 달성 여부, 월간 시간표, 음악 재생 기록 등 우리 생활 속의 데이터를 활용한 시각화 사례를 소개해 드리려고 합니다. 사례를 살펴보면서 데이터를 어떻게 시각화했는지, 이를 통해 어떤 인사이트를 발견할 수 있는지 알아보겠습니다.
우리가 일상에서 직접 데이터를 수집하기 위해서는 무언가를 ‘기록’할 필요가 있는데요! 지금까지 기록해 왔던 것이 무엇이 있을까 곰곰이 생각해 본다면 저는 ‘목표’가 가장 먼저 떠오릅니다. 하루 단위부터 주, 월, 연간 목표까지 기록해 둔 뒤 하나씩 성취해 낼 때마다 뿌듯함을 느끼곤 하는데요. 목표 달성 기록은 어떻게 시각화할 수 있을까요?
위 시각화는 연 단위 달력에 일정한 그림을 그려서 목표 달성 여부를 표현한 것입니다. 오른쪽 상단을 보면 세 가지의 목표가 기재되어 있는데요! ‘10페이지의 책 읽기’는 빨간색, ‘오후 10시 30분까지 잠자리에 들기’는 주황색, ‘매일 집 밖으로 나가기’는 노란색으로 목표별 고유 색을 가지고 있어요. 삼각형을 세 조각으로 나누어서 특정 목표를 달성했다면 목표에 해당하는 칸을 고유한 색깔로 칠하는 방법으로 목표 달성 여부를 표현했습니다.
위 달력에서는 날짜 위에 그려진 삼각형의 완성도에 따라서 목표를 얼마큼 달성했는지 일별로 파악할 수 있습니다. 예를 들어 삼각형이 완전하게 채워져 있다면 세 가지의 목표를 모두 달성했고, 삼각형의 일부분인 빨간색 조각만 채워져 있다면 그날은 ‘10페이지의 책 읽기’ 목표만 달성했다는 것을 직관적으로 알 수 있죠! 마찬가지로 전체적인 달력을 보았을 때 삼각형의 완성도를 통해 어느 달의 목표 달성률이 가장 높은지 쉽게 이해할 수 있습니다.
달력에 작은 그림을 그리기만 하면 시각화가 완성되니, 가장 따라서 시도해 볼 법한 사례로 보이는데요! 1년이 모두 지나고 나서 시각화를 되돌아봤을 때, 알록달록한 도형이 달력을 빼곡히 채우고 있는 모습을 보면 뿌듯함이 배가 될 것 같다는 생각이 듭니다.
위 대시보드는 연간 운동 목표의 달성률과 달성량을 나타낸 것입니다. 대시보드의 왼쪽에는 주, 월, 연 단위의 목표치와 현재 달성량이 수치로 적혀 있고, 하단에는 운동 종목별 현재 목표 달성률이 각기 다른 색의 100% 가로 막대 차트로 표현되어 있는데요! 가로 막대 차트의 진한 막대는 달성률을 의미하며, 전체 막대에서 진한 막대의 비중이 클수록 목표 달성에 가까워졌다고 해석할 수 있습니다.
대시보드의 오른쪽에는 한눈에 연간 운동 목표의 월별 달성량을 비교해 볼 수 있는 폴라 차트가 그려져 있는데요! 항목 수에 따라 원을 같은 간격으로 나누고 항목마다 수치형 변수의 크기에 비례해 조각을 그렸습니다. 데이터의 크기를 막대의 길이로 표현하는 막대 차트를 동그랗게 말아 놓고, 막대를 파이 차트의 조각처럼 그린 것이라고도 볼 수 있어요. 위 사례에서는 열두 달로 원을 나눈 뒤 월별 운동 목표 달성량에 따라 조각의 크기를 달리했는데요! 월별로 어느 달에 가장 목표 달성량이 많았는지, 혹은 어느 달에 가장 목표 달성량이 적었는지 빠르게 확인할 수 있습니다.
또한 월별 조각들은 운동의 종목에 따라 색이 구분되기 때문에 월별로 어느 종목의 운동을 많이 했는지 알 수 있는데요! 예를 들어, 4월에는 노란색 조각이 큰 비중을 차지하는 것으로 보아 스키를 가장 많이 탔다는 것을 직관적으로 파악할 수 있습니다.
시간은 금이라는 말, 다들 한 번쯤은 들어 보셨죠? 시간이 소중한 만큼 제 주변에는 시간표 등으로 시간 사용 계획을 기록해 두시는 분들이 많았는데요! 시간표 속의 시간대별 일과 또한 데이터로 시각화해 보면 시간 사용에 대한 새로운 인사이트를 발견할 수 있습니다.
위 시각화는 아기가 태어난 후 한 달 동안의 육아 활동을 시간대별로 표현한 것입니다. x축을 아기가 태어난 날로부터 흐른 날의 수, y축을 자정부터 다음 날 자정까지 24시간을 2시간 간격으로 구분한 시간대로 나타냈어요. 위 사례에서는 시간대별로 기록한 육아 활동의 형태가 4가지 색의 원으로 구분되는데요! 하늘색은 아기를 목욕시키는 것, 보라색은 모유 수유, 분홍색은 기저귀 갈기와 모유 수유를 모두 하는 것, 그리고 노란색은 기저귀를 가는 것을 의미합니다.
원들의 분포를 통해서 특정 시간대에 주로 어떤 활동을 했는지에 대한 패턴을 파악할 수 있는데요! 예를 들어, 하늘색 원이 매일 비슷한 위치에 분포한 것을 보고 매일 저녁 7시에서 9시에 일정하게 아기를 목욕시켰다는 사실을 알 수 있습니다. 또, 원의 분포를 통해 어떤 활동을 가장 오랜 시간을 들여 진행했는지도 파악할 수 있는데요. 빨간색 원이 차트 영역의 대부분을 차지하는 것으로 보아, 한 달 중 가장 많은 시간을 기저귀 갈기와 모유 수유에 할애했다고 이해할 수 있습니다.
위 사례는 정형화된 차트의 형태는 아니지만, 간단한 색과 도형으로 데이터를 표현했기 때문에 시각화에 대해 전문적으로 알지 못하는 사람도 쉽게 이해할 수 있는 시각화 형태로 보여요.
이전의 사례에서는 하루 24시간 동안의 시간 사용 기록을 모두 시각화했다면, 하루 중 특정 일과의 시간대만을 모아 시각화한 사례도 있는데요!
위 시각화는 일별로 기상과 취침 시간을 점으로 표현한 산점도로 보이는데요! x축은 기상 시간으로 새벽 4시부터 아침 9시까지의 시간을, y축은 취침 시간으로 오후 8시부터 새벽 3시까지의 시간을 나타냅니다.
사례의 산점도처럼 점들이 상향 혹은 하향과 같은 뚜렷한 패턴을 그리지 않는다면 특별한 인사이트를 도출하기 어려울 수 있는데요! 위 차트에서는 x축 하단, 그리고 y축 왼쪽에 개별 값을 의미하는 선들이 그려져 있어 차트의 이해를 더할 수 있습니다. 데이터의 분포를 알 수 있도록 일별 기상, 취침 시간을 시간대에 맞게 선으로 표현한 것으로 보이는데요. 기상 시간은 상대적으로 모든 시간대에 고르게 분포한 반면 취침 시간의 경우 오후 9시부터 11시까지의 시간대에 집중적으로 분포한 것을 확인할 수 있습니다.
특히 기상이나 취침과 같은 일과는 매일 반복되기 때문에 의식하지 않으면 패턴을 알기 어려운데요! 이렇게 시간대 데이터를 수집하고 시각화해 보면 반복되는 생활 패턴을 파악할 수 있으니, 건강을 관리하는 데에도 도움이 될 것 같다는 생각이 들어요.
한편, 우리는 바쁜 일상에서 잠깐이나마 활력을 불어넣어 줄 취미 생활을 즐기기도 하는데요. 취미 생활의 기록을 시각화해 보면, 몰랐던 나의 구체적인 취향을 발견하면서 나에 대한 이해를 높이는 기회가 될 수 있지 않을까요?
위 사례는 음악 스트리밍 서비스 스포티파이에서 재생한 노래 데이터를 시각화한 대시보드입니다. 데이터 중에서도 가장 많이 재생한 노래들의 가수에 대한 다양한 차트를 제작했는데요! 대시보드의 오른쪽을 보면 가수들에게 1위부터 10위까지 순위를 매겨 표현한 비례 도형도를 볼 수 있습니다. 비례 도형도란 범주형 변수 항목별로 도형을 그리고, 도형의 크기로 수치형 변수 데이터의 크기를 표현하는 차트인데요! 위 사례에서는 네모를 사용해 가수별 재생 시간 길이의 차이를 나타냈습니다. 네모가 클수록 해당 가수의 노래를 재생한 시간이 길고, 네모가 작을수록 재생 시간이 짧다고 해석할 수 있어요.
또한, 2022년 기준 순위를 주황색, 역대 종합 순위를 초록색으로 나타내어 순위의 변화를 비교할 수 있는데요! 2022년에는 ‘테임 임팔라(Tame Impala)’가 14.7시간으로 1위지만, 역대 종합 순위를 보면 ‘킹스 오브 리온(Kings of Leon)’이 165시간으로 1위인 것을 파악할 수 있습니다. 위 대시보드의 제작자는 2022년 테임 임팔라의 노래를 가장 선호했지만, 지금까지 들었던 모든 노래 중에서는 킹스 오브 리온의 노래를 가장 선호한다고 추측해 볼 수 있죠!
대시보드 하단을 보면 역대 노래 중 재생 횟수 기준 상위 5개의 노래를 뽑아 시각화한 막대 사탕 차트를 볼 수 있습니다. 막대 사탕 차트는 막대 차트와 점 차트를 합친 형태로, 범주형 변수의 항목별로 막대를 그리고 그 끝에 원을 표시하는 것이 특징인데요! 원의 위치와 막대의 길이를 기준으로 데이터의 크기를 비교할 수 있습니다. 모든 재생 기록 중 ‘R U Mine?’이라는 곡의 막대 길이가 가장 길고, 원의 위치가 가장 우측에 위치한 것을 보아 재생 횟수가 가장 많다는 것을 확인할 수 있죠!
위 사례에서는 막대의 끝에 음표 모양의 아이콘을 사용해 시각화하는 데이터의 주제가 노래라는 것을 직관적으로 드러내고 있어 더욱 인상 깊었는데요! 개인의 데이터를 시각화한 대시보드인 만큼 차트의 시각화 요소 하나에도 제작자의 개성을 담은 것으로 보여요.
위 사례는 많은 사람이 이용하는 OTT 서비스인 넷플릭스의 개인 시청 기록을 시각화한 누적 막대 차트입니다. 누적 막대 차트는 막대 전체 길이를 기준으로 데이터를 비교할 수 있고, 막대별 조각을 기준으로도 데이터를 비교할 수 있는 차트인데요! x축을 요일, y축을 콘텐츠 시청 시간으로 나타냈습니다. 막대별 조각은 세 가지의 색으로 구분되며, 노란색은 애니메이션, 파란색은 다큐멘터리, 하얀색은 나머지 장르를 의미해요.
위 사례에서는 1년간의 요일별 시청 시간을 비교할 수 있는 동시에 요일마다 어느 장르의 콘텐츠를 오래 시청했는지 비교할 수 있는데요! 먼저 요일별 막대의 길이를 비교해 보면 일요일의 총 시청 시간은 2일 9시간 31분으로 모든 요일 중 가장 오래 넷플릭스를 시청한 요일이라고 해석할 수 있습니다. 이어서 일요일 막대 안 조각들의 크기를 비교해 보면 파란색의 다큐멘터리 조각이 21시간 47분으로 시청 시간 중 가장 큰 비중을 차지하고 있는 것을 알 수 있어요. 위 대시보드의 제작자는 일요일에 다큐멘터리를 시청하는 것을 선호한다고 추측해 볼 수 있습니다.
저는 주로 넷플릭스에서 무작위로 추천되는 콘텐츠를 선택하기 때문에, 새로운 콘텐츠를 시청할 때 취향에 맞지 않아 실망하는 경우가 종종 있었는데요! 이렇게 시청 기록을 시각화해 본다면 저의 콘텐츠 선호도를 파악할 수 있어 넷플릭스를 더욱 효율적으로 이용할 수 있을 것 같다는 생각이 들었어요.
지금까지 목표 달성 기록, 시간 사용 기록, 그리고 취미 생활 기록을 시각화한 사례들을 살펴보았는데요! 실제 태블로 사용자들이 수집한 데이터가 활용되어서인지 정형화된 차트보다는 개인의 개성과 데이터의 특징을 살린 차트를 찾아볼 수 있어 더욱 흥미로웠습니다.
데이터를 활용할 때 가장 필요한 자질 중 하나는 도메인에 대한 이해입니다. 데이터를 수집한 분야의 충분한 지식이 있어야만 데이터 안의 숨은 의미를 꿰뚫어 볼 수 있기 때문이에요. 그렇다면, 우리는 모두 ‘나’의 일상 데이터를 활용할 때 어떤 데이터를 활용하는 것보다 통찰력 있는 인사이트를 도출할 수 있지 않을까요? ‘나’를 제일 잘 아는 사람은 바로 ‘나’ 자신이니까요!
아직 데이터를 활용해 본 경험이 없으시다면, 오늘 소개해 드린 사례를 참고해 나만의 데이터를 시각화해 보시는 건 어떨까요? 이번 콘텐츠가 여러분이 데이터 활용의 첫걸음을 내딛도록 도울 수 있기를 바랍니다.