새로운 장소에서 길을 찾을 때, 우리는 자연스레 지도를 찾고는 합니다. 지도만 있다면 모르는 길이라도 목적지를 찾아가는 데 두려움이 없어지는데요! 오늘은 데이터를 탐색할 때 역시 훌륭한 길잡이가 되어 주는 ‘지도 시각화’ 유형에 관해 이야기해 보려고 합니다.
지도 시각화는 위치 정보를 포함한 데이터를 지도 위에 표현하는 시각화 유형입니다. 데이터의 위치 정보는 위도, 경도 값이나 지역명, 주소 등으로 존재하는데요. 지도 시각화를 활용하면 데이터를 문자로 읽을 때보다 데이터가 가진 인사이트를 훨씬 직관적으로 도출할 수 있어요!
지도 위 데이터를 표현하는 방법은 여러 가지가 있는데요! 지도 시각화를 활용하는 목적에 따라 지도 위의 특정한 영역 혹은 지역에 색이나 도형으로 데이터의 크기를 달리 표현하는 방법이 있습니다. 방법에 따라 지도 시각화는 여러 유형으로 나뉘는데요. 지금부터 각기 다른 표현 방법을 활용한 지도 시각화 사례를 살펴보면서 각 시각화 유형마다 어떤 특징을 가졌는지, 데이터를 어떻게 효과적으로 표현했는지 알아보겠습니다.
가장 먼저, 지도 위 영역의 색을 달리해 데이터를 표현한 단계 구분도 사례를 살펴보겠습니다. 단계 구분도는 지역별 영역에 색으로 수치형 데이터의 크기를 표현한 시각화 유형입니다. 지도 시각화의 다양한 유형 중에서 가장 쉽게 볼 수 있는 유형이기도 한데요! 데이터의 크기에 따라 색의 진하기에 단계를 두어 쉽게 지역 간 데이터를 비교할 수 있습니다.
위 사례는 2018년 미국 의회에서 정의한 사회적 자본 지수를 나타낸 단계 구분도입니다. 사회적 자본이란 국가 정책이나 제도에 대한 국민의 신뢰도, 사회 구성원 간 협력 정도 등 사회가 바르게 기능하도록 하는 무형의 자산을 뜻하는데요! 위 사례에서는 미국의 행정 구역 단위인 카운티에 따라 지도 위 영역을 구분하고, 각 카운티의 사회적 자본 지수에 따라 색을 칠했습니다. 사회적 자본 지수가 낮을수록 짙은 빨간색, 높을수록 짙은 회색으로 표현했어요. 위 지도 시각화의 인사이트를 찾아볼까요?
미국의 남서쪽과 동남쪽 행정 구역이 대부분 붉은색이고, 북동쪽과 중앙은 회색인 것을 보아 남서쪽, 동남쪽의 사회적 자본 지수가 저조하다는 것을 한눈에 파악할 수 있는데요! 이 인사이트를 기반으로 사회적 자본이 부족한 카운티에 우선순위를 두고 사회적 자본의 확보 및 축적과 관련한 정책을 효율적으로 시행할 수 있을 것으로 보입니다.
다음으로 알아볼 시각화 유형은 히트맵입니다. 히트맵 역시 지도 위 색으로 데이터를 표현한다는 점에서 단계 구분도와 공통점이 있지만, 단계구분도는 행정 구역상 지역별 영역에 데이터의 크기에 따라 색을 표현하고, 히트맵은 그렇지 않다는 점에서 차이가 있습니다.
위 사례는 2022년 7월 미국의 전국 열지수를 지도 위에 나타낸 히트맵입니다. 열지수란 기온과 습도를 결합했을 때 체감되는 온도를 뜻하는데요! 사례에서는 열지수를 주의(노란색), 매우 주의(주황색), 위험(빨간색), 매우 위험(짙은 빨간색) 총 4단계로 구분했어요. 색이 짙을수록 열지수가 높음을 의미합니다.
단계 구분도와는 다르게 히트맵은 지역별 영역에 따라 색이 표현되지 않기 때문에 특정 지역별로 인사이트를 도출하기보다는 전체적인 데이터의 분포 또는 밀집도를 바탕으로 인사이트를 도출할 수 있는데요! 위 지도에서는 동남쪽 지역에 빨간색, 주황색 영역이 넓게 분포한 것을 보아 해당 지역의 날씨가 매우 덥다고 해석할 수 있습니다.
지금까지는 지도 위 영역에 색으로 데이터의 크기를 구분한 지도 시각화 유형을 살펴보았는데요. 지도 위에 점, 선, 도형 등의 시각화 요소를 더해서 데이터를 표현할 수도 있습니다. 어떤 유형이 있을지 알아볼까요?
첫 번째는 지도상에 모든 데이터의 위치를 점으로 표현하는 점 밀집도입니다. 점 밀집도에서는 점의 분포를 바탕으로 데이터를 해석할 수 있는데요! 사례를 살펴보겠습니다.
위 사례는 잉글랜드의 역사적 건축물을 보호하기 위해 설립된 단체인 ‘잉글리쉬 헤리티지(English Heritage)’에서 추진하는 ‘블루 플라크(Blue Plaque)’ 설치 현황을 런던 지도에 나타낸 점 밀집도입니다. 블루 플라크는 역사적으로 중요한 인물 및 사건과 관련된 건축물들을 선정해 부여하는 표식을 뜻하는데요! 위 시각화에서 점이 밀집된 위치를 바탕으로 중앙 지역에 빼곡하게 블루 플라크가 설치된 것을 확인할 수 있습니다.
하지만 이렇게 점이 빼곡하게 놓아진 지도 시각화는 밀집한 점에 가려져 구체적인 지역마다의 데이터 분포를 알기 어려울 수 있는데요! 그럴 때는 스크롤로 지도를 축소, 확대하거나 지역을 이동할 수 있는 인터랙티브 차트로 만들어서 데이터를 탐색할 수 있도록 한다면 지도 시각화의 더 큰 효과를 경험할 수 있습니다.
사실 앞서 살펴본 점 밀집도 사례는 인터랙티브 지도 시각화로 제작되었는데요! 지도를 확대해 보니 이전에는 점에 가려 보이지 않던 템스강의 위치와 그 주변의 블루 플라크 분포를 확인할 수 있었습니다. 블루 플라크가 강 주위 건물들을 위주로 설치되어 있네요! 템스강 근처 거리를 걷다 보면 어렵지 않게 파란 명패를 볼 수 있겠어요.
또 다른 사례도 살펴볼까요? 위 시각화는 2021년 6월 뉴스젤리와 한국일보의 협업으로 제작한 점 밀집도인데요! 2020년 6월부터 2021년 5월까지의 중대 재해 중 고용노동부가 작성한 410건의 재해조사 의견서를 토대로 중대 재해가 발생한 사업장의 위치를 시각화했습니다. 앞서 살펴본 사례의 경우 모든 점이 같은 색이었던 것에 반해 이번 사례에서는 점의 색깔이 회색과 빨간색으로 구분되어 있음을 알 수 있습니다.
빨간색은 2022년 1월부터 시행된 중대재해법을 적용했을 때 사업주가 처벌받지 않는 사업장을, 회색은 나머지 사업장을 의미합니다. 중대 재해란 산업 재해 중 사망 등 재해의 정도가 심한 것으로, 일정 기준을 충족했을 때 중대 재해로 인정받을 수 있는데요. 위 사례에서는 점의 분포를 통해 어느 지역에서 중대 재해가 많이 발생했는지 알 수 있을 뿐만 아니라, 중대재해법이 제정되었을 경우의 처벌 여부도 점의 색으로 구분할 수 있습니다. 수도권과 경상남도 지역의 사업장에서 중대 재해가 많이 일어났으며, 그중 일부 사업장은 중대재해법이 시행되었을 경우에도 사업주가 처벌받지 않는다는 사실을 알 수 있어요.
두 번째로는 지도 위에 선을 더해 데이터의 흐름을 나타내는 지도 시각화 유형을 알아보려고 합니다. 크게 2가지 유형이 있는데요! 먼저 연결 지도에 대해 알아보겠습니다. 연결 지도는 지도 위 특정 지점 간 직선 혹은 곡선을 그려 위치 데이터 간의 관계를 보여줄 때 활용하는 시각화 유형입니다. 대표적으로 항공 경로 데이터를 시각화할 때 자주 사용됩니다.
위 사례는 브라질 여성 축구 선수 마르타 (Marta)가 이적하면서 이동했던 나라 간 경로를 나타낸 것인데요! 브라질의 산타 크루즈 팀에서 시작해 스웨덴의 우메아 IK 팀으로, 미국 로스앤젤레스 솔 팀을 거쳐 다시 브라질로 돌아온 이적 경력을 하나의 지도 시각화에 담았습니다. 사례에서는 지점과 지점 간 곡선을 그려 이동 경로를 표시함과 동시에 곡선 끝 화살표의 방향으로 어느 지점에서 어느 지점으로의 이동인지를 나타내고 있습니다.
선으로 데이터의 흐름뿐만 아니라 크기까지 표현할 수 있는 시각화 유형으로 흐름 지도도 있는데요! 흐름 지도 역시 지도 위 특정 지점 간 직선 혹은 곡선을 그려 데이터 간의 관계를 보여주면서도, 연결 지도와 달리 수치형 데이터의 크기에 따라서 선의 굵기를 다르게 표현하는 것이 특징입니다.
위 사례는 세계에서 가장 많이 비행기를 탄 톰 스터커(Tom Stuker)의 2019년 비행 기록을 나타낸 흐름 지도입니다. 스터커는 1990년 미국의 항공사 유나이티드 에어라인(United Airlines)에서 29만 달러에 판매한 평생 이용권을 구매해 비행기를 수백 번 이용한 사람인데요! 위 사례에서는 스터커가 지난 2019년 무려 373번 비행한 경로를 경로별 횟수에 따라 선으로 시각화했습니다. 출발 지점에서 도착 지점을 향할수록 두껍고, 색이 진해지는 연결선을 사용했어요.
경로별 여행 횟수의 크기를 선의 굵기로 표현해 데이터의 크기를 비교해 볼 수도 있는데요. 예를 들어 스터커가 가장 자주 이용한 두 가지 경로는 미국 시카고에서 독일의 프랑크푸르트로, 미국 시카고에서 영국 런던으로 가는 경로였고, 각 경로를 33번 여행했습니다. 이 경로들은 지도 위 가장 굵은 선으로 표현되어서, 지도를 보았을 때 쉽게 알아볼 수 있습니다.
마지막으로 지도 위에 도형으로 데이터의 크기를 표현하는 도형 표현도를 살펴보도록 하겠습니다. 도형 표현도는 데이터를 표현할 지역별 위치에 도형을 그리고 수치형 변수 데이터의 크기에 따라 도형의 크기를 다르게 표현하는 시각화 유형입니다. 도형으로는 원을 활용하는 것이 가장 일반적이지만 데이터의 특징에 따라 다른 도형을 사용하기도 해요.
위 사례는 뉴스젤리가 제작한 문화 빅데이터 플랫폼의 문화 시설별 국내 방문객 수 도형 표현도입니다. 전국 시도별 문화 시설의 위치에 원을 그리고, 방문객의 수만큼 원의 크기를 다르게 표현했어요. 원의 분포로는 어떤 지역에 문화 시설이 많은지 파악할 수도 있고, 원의 크기로는 각 지역의 문화 시설에 얼마나 많은 사람이 방문했는지 알 수 있습니다.
이번 사례에서는 방문객이 현지인이 더 많았는지 혹은 외지인이 더 많았는지에 따라 원의 색깔을 초록색과 회색으로 나누어 데이터를 구분하기도 했는데요! 원의 색깔을 통해 각 지역을 현지인과 외지인 중 어떤 방문객이 더 많이 방문했는지 알 수 있습니다. 예를 들어, 수도권, 대구, 부산 등의 지역은 외지인에 해당하는 회색 원의 크기가 크기 때문에 외지인 방문객이 많은 문화 시설이 많다고 추측해 볼 수 있어요.
나아가 원이 아닌 도형을 활용한 도형 표현도의 사례를 한 가지 더 살펴보도록 하겠습니다. 위 사례는 우리나라의 인구 밀도를 나타낸 입체 도형 표현도인데요! 데이터의 크기를 기둥의 높이로 표현한 것이 매우 인상적이었어요.
인구 밀도가 높은 지역은 높은 기둥이 높고 촘촘하게 세워져 있는 반면, 인구 밀도가 낮은 지역은 평면에 가깝게 표현되었습니다. 또, 인구 밀도가 높을수록 붉은색을 칠해 데이터의 크기를 더욱 강조했는데요. 특히 서울은 기둥이 매우 높고, 기둥이 끝이 검붉은색으로 칠해져 있어 인구 밀도가 매우 높다는 것을 직관적으로 알 수 있습니다.
위 사례는 정석적인 차트 표현보다는 데이터 아트적인 표현이 가미되었다고 볼 수 있는데요! 지역마다의 정확한 인구 밀도를 전달하기보다는 수도권이나 대도시에만 인구가 집중된 우리나라의 현실을 예술적으로 그려냈다는 생각이 들었습니다.
지금까지 지도라는 동일한 배경에 색, 점, 선, 도형 등 각기 다른 요소를 활용한 지도 시각화 유형들을 살펴보았는데요! 다양한 사례를 직접 해석해 보니, 어떤 색과 시각적 요소를 사용하냐에 따라 다른 효과를 줄 수 있다는 사실을 알 수 있었습니다.
저는 이번 사례를 찾아보면서 다시 한번 데이터 시각화의 이점을 체감했는데요! 데이터를 수치로만 읽을 때보다 도형과 색을 사용한 시각화 그림이 데이터를 통해 전하고자 하는 의미를 더욱 직관적으로 와닿게 해 주는 것 같다는 생각이 들었어요. 여러분은 어떤 생각을 하셨나요?
지도 시각화는 위치 정보를 포함하는 데이터를 분석할 때 자주 활용됩니다. 따라서 여러 시각화 표현 방법을 숙지하고 있다면 데이터와 분석 목적에 맞게 선택할 수 있어 더욱 효과적인 데이터 시각화가 가능해지는데요. 앞으로의 콘텐츠에서도 지도 시각화와 관련된 다양한 이야기를 다뤄볼 예정이니 많은 기대 부탁드립니다! 오늘 소개해 드린 사례가 여러분의 지도 시각화 활용에 도움이 되길 바라며 글을 마칩니다.