데이터 시각화 전문가가 분석하는 2024 한국 데이터 저널리즘 어워드 수상작
지난 11월 24일, 제 7회 한국 데이터 저널리즘 어워드의 수상작이 발표되었습니다! 한국 데이터 저널리즘 어워드는 한 해 동안 한국 데이터 저널리즘 분야의 우수한 보도를 시상하는 연례행사로, 2024년에는 ‘올해의 데이터 시각화 상’, ‘올해의 데이터 저널리즘 혁신 상’을 포함한 총 6개 부문에서 시상을 진행했습니다. 매해 뛰어난 작품들을 만나 볼 수 있어 뉴스젤리도 연말연시가 되면 관심을 기울이고 있는데요. 이번에는 어떤 작품이 수상작으로 선정되었을까요?
오늘은 한국 데이터 저널리즘 어워드에서 수상작으로 선정된 총 6가지의 보도 중 에디터가 뽑은 세 작품을 소개해 드리려고 합니다. 데이터 시각화가 가장 돋보이는 작품들이었는데요. 데이터 시각화를 중심으로 작품마다의 제작 배경, 활용한 데이터부터 데이터 표현 방법의 특징까지 꼼꼼히 살펴보겠습니다!
첫 번째로 소개할 작품은 올해의 영 데이터 저널리스트 상을 받은 ‘선거 벽보, 색으로 풀어봤다!’입니다.
‘선거 벽보, 색으로 풀어봤다!’의 시작 화면 (출처: 서울대학교 RGB팀)
이번 작품은 꽤나 흥미로운 주제인데요! 여러분은 선거철 길거리에 붙은 형형색색의 벽보를 유심히 관찰해 본 경험이 있으신가요? 선거 벽보는 후보자가 자신을 표현하는 중요한 수단이죠! 그리고 그중 메인이 되는 요소인 벽보의 ‘색’은 단순한 시각 정보 이상의 의미를 담고 있습니다. 후보자가 선거 유세 중 특정한 색의 옷을 입거나, 특정한 색의 팻말을 드는 것처럼 벽보의 색 또한 의식적으로 선택해요. 유권자 역시 색으로 후보자를 구분하거나 판단하곤 하죠.
수상팀 ‘서울대학교 RGB 팀(명찬호 외 5명)’은 선거 시 ‘색’이 가지는 상징성에 주목하여 선거 벽보에서 색이 어떻게 활용되고 있는지 분석하고, 시각화했는데요. 과연 어떤 데이터를 활용했을까요?
서울대학교 RGB 팀은 중앙선거관리위원회 도서관 사이트에서 2000년부터 2022년까지 진행된 6번의 국회의원선거와 6번의 전국동시지방선거의 벽보 총 5,306장을 수집했습니다. 그리고 선거 벽보 속 후보자의 얼굴, 머리카탁 등의 색에 영향을 받지 않기 위해 인물을 마스킹 처리하고, 벽보에서 가장 많이 쓰인 색을 대표색으로 추출했는데요! 인물이 마스킹 처리된 벽보에서 유사한 색을 묶어 픽셀 수를 계산한 다음, 픽셀 수가 가장 많은 색의 rgb값을 추출했다고 합니다.
작품 전문에서는 이렇게 모인 벽보 5,306장의 대표색을 선거별, 정당별로 분석해 총 4가지 인사이트를 도출했습니다. 4가지 인사이트에서 벽보의 색에 선거 판세나 정치적 사건과 흐름이 반영되어 있다는 것을 확인할 수 있었는데요! 그중에서 2가지 인사이트에 관련된 시각화 사례를 해석해 보겠습니다!
작품에서는 4가지 인사이트에 관한 내용을 본격적으로 전개하기 전, 사용자가 각각의 내용에 관한 퀴즈를 풀 수 있도록 합니다. 첫 번째 퀴즈는 ‘총선에서 승리한 정당과 패배한 정당 중, 어느 쪽이 벽보에 정당색을 더 많이 사용했을까요?’인데요, ‘승리한 정당’을 선택해 보겠습니다.
사용자가 선택한 답변이 정답이라면 정답을 알리는 화면이 나오며 해당 내용에 관한 데이터 시각화 분석 결과 화면이 이어집니다. 제21대, 20대, 18대 총선에서 의석수를 가장 많이 차지한 두 당의 선거 벽보 데이터를 분석할 결과인데요. 시각화 차트를 조금 더 자세히 살펴보겠습니다!
위 화면에는 2가지의 시각화 차트가 활용되었는데요! 먼저 왼쪽의 유닛 차트는 제 21대 총선에서 더불어민주당, 미래통합당이 차지한 의석수를 표현하고 있습니다. 유닛 차트는 데이터를 하나씩 쪼개서 여러 개의 기호로 표현하는 차트로, 개별 기호의 개수로 데이터의 크기를 비교할 수 있는 것이 특징이에요. 따라서 더불어민주당이 차지한 163석을 163개의 원으로, 미래통합당이 차지한 84석을 84개의 원으로 표현했죠! 원이 모여 있는 차트의 모양을 실제 국회 의석 배치도와 비슷하게 나타낸 점 또한 흥미롭습니다. 이 차트를 통해 21대 총선에서 더불어민주당이 승리한 것을 알 수 있어요.
오른쪽은 각 당의 선거 벽보 대표색 데이터를 표현한 것인데요. 하나의 선거 벽보를 얇은 실선으로 표현하고, 대표색의 명암순으로 정렬했습니다. 스펙트럼의 형태를 띠는데요! 바코드 차트와 유사한 모양이기도 합니다. 바코드 차트는 실선들이 뭉치고 흩어진 모양을 통해 데이터의 분포를 확인할 수 있는 차트인데요! 더불어민주당의 정당색인 파란색, 미래통합당의 정당색인 분홍색 실선의 분포를 보면 미래통합당에 비해 총선에서 승리한 더불어민주당에서 정당색을 선거 벽보의 대표색으로 더 많이 사용한 것을 알 수 있습니다.
또 다른 퀴즈는 ‘과거와 현재 선거 벽보 색 사용에는 차이가 있을까요, 없을까요?’인데요! ‘차이가 있다’를 선택해 보겠습니다. 과거와 현재의 벽보 색 사용의 차이, 혹은 변화 추이 등을 시각화했을 것 같은데요. 어떤 유형을 활용했을까요?
작품에서는 앞서 보았던 바코드 차트를 활용해서 22년간의 진보/보수 대표 정당 선거 벽보 색을 타임라인 차트로 그렸습니다! 16대 총선부터 21대 총선과 3회 지선부터 8회 지선까지의 벽보 대표색 추출 결과 스펙트럼을 시간의 흐름에 따라 나열했어요.
과거에는 진보와 보수 대표 정당 모두 대체로 어둡고, 정당 색이 눈에 띄지 않는 벽보가 대부분을 차지합니다. 하지만 현재와 가까워질수록 더 밝고 선명한 색을 많이 쓰고 있어요. 또, 과거에는 두 정당을 비교하기 어려울 정도로 여러 색이 뒤섞여 있던 반면 최근에는 정당색을 사용하여 명확하게 정당을 비교할 수 있는 벽보가 상당수입니다. 여러분도 눈에 띄는 색의 변화가 보이시나요?
‘선거 벽보, 색으로 풀어봤다!’ 작품에서는 소개해 드린 2가지 사례 외에도 선거 벽보의 색을 선거의 성격, 정치 구도, 시간, 사건 등 다방면에서 분석 및 해석했는데요. 선행 연구에서는 대부분 정당 로고와 벽보를 단순 분류하는 수준에 그쳤으나, 나아가 더 깊은 연구를 진행했다는 점에서 의미 있는 사례였습니다.
무엇보다 인상 깊었던 것은 작품이 유도한 독자들의 인식 변화였는데요! 정치와 선거에 관한 콘텐츠는 공약, 정책 등 상대적으로 복잡하고 어렵게 느껴지는 정보를 제공하기 때문에 정치에 무관심한 사람들의 관심을 받기가 어렵습니다. 하지만 위 작품에서는 단순하고 직관적인 ‘색’에 집중하고 이것을 스펙트럼으로 가시화하여 누구나 이해하기 쉽게 설명했어요. 또한 콘텐츠 안에서 퀴즈를 풀 수 있는 인터랙티브 요소를 추가함으로써 재미를 느낄 수 있기까지 합니다. 따라서 독자의 흥미를 유발하고, 정치에 관심을 가지는 계기를 제공했습니다. 정치에 대한 심리적 진입 장벽을 낮춘 것이죠!
다음으로는 올해의 영 데이터 저널리스트 상을 받은 또 다른 작품, ‘무심코 지나치면 계단이지만, 누군가에게는 절벽이다’를 소개하겠습니다.
‘무심코 지나치면 계단이지만, 누군가에게는 절벽이다’의 첫 화면 (출처: 얼리버드 팀)
작품의 첫 화면은 지하철 이용 시 어려움을 겪는 전 씨의 일화로 시작됩니다. 휠체어를 타는 전 씨는 지하철 차체와 승강장 간의 높이차로 인해 바퀴가 열차에 걸려 넘어지는 해프닝을 겪었습니다. 하지만 이런 사고는 한 번이 아니었는데요. 또 다른 하루는 뒷바퀴가 열차에 걸려 스크린도어에 끼는 위험한 상황이 발생하기도 했습니다.
사실 지하철과 승강장 간 높이차로 인한 어려움은 전 씨뿐만 아니라 수많은 교통 약자들이 일상적으로 겪고 있는데도, 상대적으로 주목받지 못하는 문제였다고 하는데요. 영 데이터 저널리스트 상 수상팀, ‘얼리버드 팀(박건우 외 4명)’은 외면받았던 높이차 문제에 주목하여 그 실상을 데이터로 분석하고 수면 위로 드러냈습니다.
‘지하철과 승강장 간 높이차가 너무 높은 역은 어디고, 또 얼마나 높을까?’라는 질문에 해답을 찾기 위해 얼리버드 팀은 서울 교통 공사와 코레일(한국 철도 공사)에서 관할 역별 높이차 데이터를 확보했습니다. 특히 코레일 데이터는 수차례 정보 공개를 요청한 끝에 확보한 것인데요. 약자의 편의를 위해 높이차 정보를 제공하는 카카오맵, 또타지하철과 같은 서비스에서도 찾아볼 수 없는 상세 데이터라고 해요. 세상에 없던 데이터를 확보하고, 그것을 공개하려는 노력이 돋보이는 시도였죠!
수집한 코레일 관할 역별 승강장 높이차 데이터로 위와 같은 데이터 시각화가 탄생했습니다. 역 본부, 역명, 출입문 등 다양한 정보가 포함된 데이터 테이블이 보이는 한편 가장 오른쪽의 ‘높이차’ 컬럼에서 막대 차트를 찾아볼 수 있었어요! 역의 출입문별 높이차에 따라 막대의 길이를 다르게 표현한 것인데요. 역별X출입문별 높이차를 가장 직관적으로 비교할 수 있습니다. 튀는 파란색의 막대 색깔과 막대 위 기재된 데이터 수치 등이 데이터 해석을 돕기도 하죠!
승강장 단차 규정에 따르면 승강장의 높이는 승강장 바닥면과 차량 바닥면 간의 차가 ±15㎜ 이내가 되도록 설계해야 하는데요. 막대 차트를 훑어보면 15mm가 훌쩍 넘는 역들이 심심찮게 보입니다. 사용자는 왼쪽 상단의 검색 기능으로 원하는 역을 찾아볼 수도 있는데요. 교통 약자가 직접 방문하는 역을 검색해 보고, 높이차 때문에 발생하는 예기치 못한 사고에 대비할 수 있을 것 같아요.
한편 얼리버드 팀이 확보했던 또 하나의 데이터, 코레일 관할 역 승강장별 높이차 데이터는 높이차의 상세 수치를 제공하지 않았는데요. 대신에 승강장과 지하철 차체 사이의 거리를 의미하는 ‘연단 간격’과 높이차의 수치를 ‘좁음/낮음’, ‘보통’, ‘넓음/높음’ 세 단계로 표현한 데이터를 제공했습니다. 따라서 작품에서는 이 데이터를 더욱 이해하기 쉽게 표현하기 위해 ‘좁음/낮음’은 파란색, ‘보통’은 노란색, ‘넓음/높음’은 빨간색으로 바탕색을 칠했습니다.
교통 약자에게는 연단 간격이 넓을수록, 높이차가 높을수록 지하철을 이용하게 어려워지는데요. 위 차트에서 연단 간격이 ‘넓고’, 높이차가 ‘높은’ 역의 바탕에 깔린 빨간색은 마치 3색 신호등의 빨간 불처럼 교통 약자의 위험도를 누구나 감지할 수 있도록 돕습니다. 또, 위 차트 역시 왼쪽 상단에서 원하는 역을 검색할 수 있어 편리했어요.
테이블 형태의 데이터 시각화는 개별 데이터의 세부 정보를 볼 수 있다는 장점이 있지만 반대로 평균, 합계와 같이 요약된 통계 수치를 알 수 없다는 한계점도 있는데요. 작품에서는 앞서 살펴본 두 개의 시각화 차트를 보여준 뒤 위와 같이 각각의 데이터를 요약한 막대 차트를 보여줍니다.
왼쪽은 높이차를 ‘낮음’, ‘보통’, ‘높음’ 세 단계로 분류했던 서울교통공사 데이터를 활용해서 서울교통공사 관할 역 중 ‘높음’ 범주로 표시된 승강장의 개수가 가장 많은 역 10개를 표현했습니다. 오른쪽은 높이차의 세부 수치를 제공했던 코레일(한국철도공사) 데이터를 활용해서 코레일 관할 역 중 승강장의 높이 평균이 가장 높은 역 10개를 표현했어요. 두 막대 차트를 통해 각각의 데이터를 기준으로 교통 약자에게 가장 불편한 역이 어디인지 한눈에 파악할 수 있습니다.
왼쪽 막대 차트에서는 2호선 을지로입구역과 영등포구청역이 압도적으로 높이차가 높은 승강장 개수가 많습니다. 오른쪽 차트에서는 1호선 오신대역, 성균관대역, 동인천역 순으로 평균 높이가 높네요.
실제 작품에서는 역별 높이차 데이터 분석 외에도 장애인이 겪는 지하철 승하차 시 어려움, 역별 승강장-지하철 간 높이차 극복을 돕는 이동식 안전 발판의 유무 등 다양한 측면을 분석했습니다. 그리고 작품의 말미에는 높이차 문제의 해결 방안으로 데이터 공개와 정보의 공공화를 강조했는데요! 뉴스젤리 역시 ‘누구나 데이터를 활발히 사용할 수 있는 세상’을 꿈꾸기에 큰 공감이 가는 대목이었어요.
시중에 존재하는 지하철 앱에는 서울교통공사 관할 역이 아니라면 높이차 데이터를 확인할 수 없다고 합니다. 좋지 않은 정보 접근성 때문에 교통 약자는 지하철 역을 찾아가도 탑승이 어려운 상황을 빈번하게 맞닥뜨릴 수 있죠. 이 문제를 해결하기 위해 얼리버드 팀은 작품에서 데이터 시각화로 데이터를 전체 공개하고, 그동안 주목받지 못했던 지하철 높이차의 심각성을 휠체어 탑승자의 시점으로 녹여냈어요. 작품이 보도됨에 따라 높이차 문제의 심각성을 알리고 교통 약자의 어려움도 조금이나마 해소되기를 기대할 수 있게 되었어요! 정보의 공공화를 위한 노력이 돋보이는 훌륭한 작품이었습니다.
마지막으로 소개할 작품은 데이터 기반 탐사보도 상을 받은 ‘흔적, 가난한 노인의 낮과 밤’입니다.
이번 작품은 앞서 소개한 두 작품이 하나의 웹사이트였던 것과 달리 한 편의 다큐멘터리 영상과 다큐멘터리 제작 과정 및 배경을 구체적으로 설명하는 네 편의 기사로 구성됩니다. 다섯 개의 콘텐츠에서는 대한민국의 ‘노인 빈곤’ 문제의 구조적 특징을 다루는데요! 수상팀 KBS 팀(서영민 외 8명, 협업기관: KT&VWL&서울대학교 건축학과)은 현장을 비추는 다큐멘터리를 제작하기 위해 노인의 삶과 밀접한 관련이 있는 수많은 장소를 직접 돌아다니며 취재하고, 노인 이동 빅데이터를 면밀하게 분석했습니다.
수상작에서 사용된 데이터는 KT 휴대전화 고객의 이동 통신 데이터입니다. KT 가입자가 전체 인구의 약 1/3인 만큼, 가난한 노인의 특성을 모수에 가깝게 확보할 수 있었다고 하는데요. 전체 데이터 중 60대 이상 인구를 추출한 다음, 기초 생활 수급자 대상의 할인 요금제를 사용하는 인구와 일반 요금제를 사용하는 인구를 분류하여 ‘가난한 노인’과 ‘일반 노인’ 데이터를 수집했습니다.
작품에서는 이 데이터를 활용해서 다양한 지도 시각화를 시도했는데요. 그중 다큐멘터리 영상의 주목할 만한 두 가지 시각화 사례를 살펴보려고 합니다!
먼저 서울 지도 위에 나타낸 네트워크 시각화가 눈에 띄었습니다. 네트워크 시각화는 네트워크 시각화는 데이터 항목을 의미하는 원과 데이터 항목 간 관계를 의미하는 선으로 구성된 시각화 유형입니다. 관계가 있는 원끼리 선을 이어서 관련성을 표현하는데요. 위 지도는 ‘일반 노인’의 겹치는 동선을 시각화한 것입니다.
원의 크기가 클수록 많은 인구가 모이는 지역으로 추정되는데요. 서울 전역의 데이터를 활용한 것임에도 겹치는 장소와 동선이 그리 많지 않습니다. 서울역 인근 남대문 시장 주변, 고속 터미널, 이수역 등 교통 중심지 몇 곳을 제외하면 공통의 행동 특성이 적다고 볼 수 있었어요.
반면 ‘가난한 노인’에게는 뚜렷한 공통의 행동 양식이 있었는데요! 가난한 노인 데이터로 네트워크 시각화를 표현한 결과 원이 분포한 장소가 더 많고, 그 사이를 잇는 선이 훨씬 조밀하게 겹쳐 있는 것을 볼 수 있습니다. 특히 중앙의 구시가지, 종로를 중심으로 원과 선이 뭉쳐 있는데요. 조금 더 확대해 볼까요?
원과 선들이 뭉친 지역을 확대해 보면 종로 3가부터 청량리 전역에 가난한 노인의 이동 동선이 밀집한 것을 볼 수 있습니다. 특히 맨 왼쪽, 탑골 공원 주변으로 큰 원들이 다수 위치해 있는데요. 탑골 공원은 사각지대의 노인들에게 무료로 식사를 제공하는 급식소, 노인들이 모여 바둑이나 장기를 두는 거리, 서울 최대의 노인 복지 센터 등이 있기 때문입니다. 데이터를 시각화하니 일반 노인과 가난한 노인의 주요 활동 반경과 이동 경로에서 확연한 차이가 드러나죠?
같은 데이터에서 이번에는 밤 10시부터 새벽 3시까지 5시간 동안 가난한 노인이 머문 위치를 지도 위에 표시했는데요. 이를 통해 가난한 노인 인구의 거주지를 추정해 볼 수 있었습니다. 위 시각화는 타일 격자 지도(그리드 맵)로, 모든 지역을 일정한 크기의 정사각형 모양으로 고정하고 데이터 수치에 따라 색을 다르게 표현하는 유형인데요. 작품에서는 서울 전역을 가로세로 250미터 단위로 나누어 지도를 그렸습니다. 가난한 노인 인구 밀도가 높은 지역일수록 선명한 빨간색에 가깝게, 낮을수록 흐릿한 초록색에 가깝게 표현했어요.
지도의 곳곳에 유난히 빨간 지역들이 보이는데요! 가장 밀도가 높은 지역 중 하나인 종로구 낙원동의 한 지역은 가로세로 250미터에 불과한 지역 안에 무려 2,348명의 노인이 거주하고 있다고 합니다. 주로 쪽방촌이나 고시원 등 열악한 주거 환경에서 지내고 있죠. 지도를 보니 어떤 지역에 얼마나 많은 ‘가난한 노인’이 분포해 있는지, 그 환경은 얼마나 열악한지 한눈에 파악할 수 있습니다.
오늘의 글에서는 두 가지 시각화 사례를 중심으로 작품을 살펴봤지만, 실제 작품에서는 더욱 깊이 있는 내용을 다루고 있었습니다. 밀도 높은 현장 취재로 노인 주거 빈곤의 특징과 문제, 그리고 빈곤 현상을 야기하는 사회적 구조의 문제를 드러내고, 빅데이터를 활용해 문제적 현상을 실시간으로 파악할 수 있도록 했죠! 문제를 빠르게 파악하면 해결책도 빠르게 도출할 수 있기 마련입니다. 이 작품이 노인 빈곤의 실마리를 제공해 준 것 같아요.
특히 작품의 메인 콘텐츠였던 다큐멘터리는 다양한 데이터 시각화를 활용해 노인 빈곤 현상을 다각도로 전달하면서, 뛰어난 데이터 스토리텔링력을 보여주었어요. 여러분도 한번 시청해 보시기를 추천해 드립니다!
지금까지 데이터 시각화 사례를 중심으로 2024 데이터 저널리즘 어워드의 3가지 수상작을 살펴보았습니다. ‘선거 벽보, 색으로 풀어봤다!’ 작품은 다소 어렵게 느껴졌던 선거, 정치 주제를 퀴즈와 데이터로 알아보는 것이 매우 재미있었습니다. 벽보의 대표 색으로 만들어진 스펙트럼이 데이터에 시각적 활기를 불어넣어 주었죠! 한편, ‘무심코 지나치면 계단이지만, 누군가에게는 절벽이다’와 ‘흔적, 가난한 노인의 낮과 밤’으로는 몰랐던 사회 현상의 민낯을 데이터로 확인할 수 있어 숙연해지기도 했는데요. 그저 이야기로만 들었다면 머릿속을 스쳐 지나갔을 텐데, 이야기에 데이터를 더하니 확실히 설득력이 강하다고 느껴졌어요. 여러분은 어떤 생각을 하셨나요?
오늘 소개해 드린 세 작품 외에도 우수한 평가를 받은 작품들이 있습니다. 모두 끈질긴 취재와 열정적인 데이터 수집 및 분석으로 제작된 보도인데요! 독자에게 큰 울림을 주는 이야기들을 담고 있으니 관심이 있으신 분들은 오늘의 글과 함께 직접 작품을 보시면 좋을 것 같습니다. (오늘 소개한 수상작을 포함한 역대 수상작은 이 링크에서 보실 수 있습니다.)