안녕하세요? 2023년 SBS D포럼을 36일 앞두고 보내드리는 지적인 당신을 위한 인사이트, SDF다이어리입니다. SDF는 올해 초거대 AI의 등장으로 언론의 생태계는 어떻게 달라지게 될지 또한 주요한 관심사로 들여다보고 있는데요. 모든 분야의 기존의 공식이 뒤바뀌고 있는 이때, 언론은 어떤 방향성을 가지고 더 좋은 보도를 해 나가야 할까요? 언론과 AI는 어떻게 새로운 관계를 맺게 될까요? 언론의 고민이 넓고 깊어질 수밖에 없는 시점입니다.
 
이 질문에 대한 힌트를 얻기 위해 AI와 저널리즘에 대해 앞서 고민하고 새로운 시도를 하고 있는 SBS의 데이터 저널리스트 배여운 기자를 만나 이야기를 나눠봤습니다. 
Q. 안녕하세요? 먼저 간단히 자기소개 먼저 부탁드립니다. 더불어 데이터 저널리스트가 무엇인지도 설명 부탁드립니다. 일반 취재기자와는 어떻게 다른가요?
네. 저는 SBS 데이터 저널리즘팀 ‘마부작침’이라고 하는 팀에서 데이터를 활용해 기사를 쓰고 있고요. 주로 데이터 저널리즘 기법을 활용한 보도를 하기 위해서 매일 같이 데이터를 바라보고 있습니다. 

그리고 요즘에는 ‘굳이 데이터 저널리스트와 일반 취재기자를 구분할 필요가 있나?’라는 생각도 하는데요. 왜냐하면 최근에 취재기자들이 판결문 분석을 한다든지 혹은 공공데이터를 가지고 와서 간단하게 통계를 내서 기사에 활용하는 것 자체가 사실 데이터 저널리즘이라는 기법을 활용하는 것이거든요. 그런데 차이를 설명하자면 저 같은 경우에는 ‘데이터 드리븐’(데이터 중심 결정)을 더 들어가는 것 같아요. 

일반 기자들에게 취재원이라고 하면 사실 사람이죠. 그리고 취재원을 통해서 기사의 소스들이 많이 나오게 되고 이를 취재해서 기사 보도로 이어지게 되는데요. 저 같은 데이터 저널리스트에게 취재원은 데이터입니다. 제가 데이터에게 어떻게 더 정밀하게 질문을 하고 또 기술적으로 접근을 하는지에 따라 데이터가 답변하는 부분이 달라지기 때문에 저는 조금 더 일반 취재기자들보다는 더 데이터 드리븐(데이터 중심 결정)에 집중해서 접근하는 게 조금 차이라고 볼 수 있을 것 같습니다. 질문에 대한 답을 데이터를 통해서 찾는 거죠. 
Q. 기억에 남는 데이터 저널리즘 기사는 어떤 것들이 있으신가요?
저는 데이터를 활용한 공직 감시에 되게 관심이 많거든요. 특히 지방의회를 감시하는 거에 큰 관심을 가지고 있습니다. 왜냐하면 국회 같은 경우는 모든 언론사에서 다 감시를 하고 있어요. 잘 드러나기 때문이죠. 하지만 우리 실생활에 직접적인 관련이 있는 곳 중의 하나가 우리 동네의 지방의회인데, 제가 분석을 시작하기 전까지 지방의회는 사실 좀 사각지대에 많이 놓여 있었거든요? ‘지방의회는 업무추진비를 잘 쓰고 있을까? 지방의원들은 법과 규칙을 잘 지키고 있을까?’라는 의문이 들었습니다. 우리의 큰 관심에서 벗어나 있지만 그들도 공직자이기 때문이죠. 

그렇게 질문을 던지고 나서 지방의회와 관련된 업무추진비 데이터, 혹은 공직자 재산데이터에 대해 정보공개 청구를 하거나 또 다양한 방법으로 데이터를 수집해서 분석을 했더니 실제로 방만한 경영을 하면서 공직에 임하고 있는 케이스들이 많았습니다. 
또 제가 데이터를 한참 보고 분석을 하다 보면 어떤 인사이트들이 나오는 경우가 있는데요. 최근 3월의 일인데, 전국의 모든 필지, 토지 데이터를 정부에서 공개하고 있는 게 있습니다. 필지에 대한 정보들이 다 들어있는 데이터거든요. 그렇게 많은 데이터를 보다 보니 토지 거래일이 일제 강점기거나 소유자 구분이 창씨개명 혹은 일본인이라고 표시가 되어 있던 땅들이 보이기 시작한 겁니다. 그래서 그런 땅들이 무엇인지 좀 더 자세히 보기 위해서 지도 위에 시각화를 해봤더니, 이게 웬걸? 첨성대 앞의 땅들이 아직도 일본인 명의로 남아 있었던 게 있던 거죠. 일본의 잔재가 남아 있는 건데, 그런 경우는 질문으로 시작하지는 않았지만 데이터 분석을 하면서 찾았던 기억에 남는 사례입니다.  
Q. 데이터 저널리스트로서 취재 과정에서 가장 난이도가 높거나 혹은 신경을 쓰는 부분은 뭔가요?
일단 가장 난이도가 높은 건 데이터 수집인 것 같아요. 그러니까 사실 첫 단추부터가 굉장히 어렵습니다. 왜냐하면 저는 데이터 저널리즘을 주로 요리와 비슷하다고 생각을 하거든요. 좋은 요리는 결국 좋은 재료에서 시작하는 것처럼 좋은 데이터 저널리즘 기사는 결국 좋은 데이터, 양질의 데이터에서 시작하기 때문이죠. 때문에 양질의 데이터를 얻으려고 많은 노력을 하고 있습니다. 대표적인 예가 정보공개 청구인데요. 사실 우리나라 같은 경우는 정부가 ‘데이터를 많이 공개하고 있다’고 자평을 하고 있지만, 데이터 저널리스트 입장에서 보면 사실 데이터의 질과 양이 썩 좋지는 않아요. 정보 공개 청구를 했을 때 사실 공개되는 경우가 많이 없기도 하고요. 그래서 정보공개법을 잘 공부해서 정부나 지자체가 정보 공개를 할 수밖에 없게끔, 방법을 찾아서 그렇게 기술적으로 정보공개 청구를 좀 많이 하고 있는 편입니다. 

그리고 그렇게 얻은 데이터는 결국 ‘로우 데이터’를 얻은 거거든요. 바로 데이터 분석을 하기는 힘들어요. 요즘 AI가 유행이지만, 기본적으로 AI는 데이터를 학습시켜야 하는데 학습시키기 조차 어려운 데이터들을 보통 많이 받거든요. 데이터 정제를 해야 되는데 거기에서 시간을 많이 차지하게 되죠. 

그런데 제가 이 일을 시작하고 나서 늘 신념처럼 생각하는 것은 데이터 저널리즘이라는 게, ‘데이터’와 ‘저널리즘’을 결합한 단어인데 데이터보다는 저널리즘에 좀 더 방점을 둬야 한다고 생각하거든요. 제가 만들고 있는 제일 마지막 결과물은 기사니까요. 저널리즘 측면에서 위배되는 것들이 없는지를 많이 신경 쓸 수밖에 없고 실제로 그렇게 하고 있습니다. 이 부분이 제가 일반 IT업계의 데이터 분석가와 언론의 데이터 저널리스트의 차이라고 생각하는 부분입니다. 효율적인 것보다 조금 더 시간이 걸리더라도 왜곡되지 않고 틀리지 않는 숫자가 보도되도록 하는 것이죠. 
Q. 데이터 저널리즘의 가장 큰 장점은 무엇이라고 보세요?
결국에는 객관적이라는 게, 객관적인 보도가 가장 큰 장점이지 않나?라고 생각을 합니다. 데이터라는 것은 결국 어떤 흔적이고 누가 반박할 수 없는 되게 객관적인 자료 중에 하나거든요? 이를 분석해서 어떠한 결과, 숫자를 뽑아내고 보도를 했다는 것은 논란이 있을 수가 없는 보도기 때문에. 제가 아니더라도 동일한 데이터를 활용해서 누군가 분석을 한다면 똑같은 결과가 나온다는 것이 데이터 저널리즘의 장점이 아닐까 생각합니다.
새로운 저널리즘의 탄생으로 여겨졌던 데이터 저널리즘이 국내에 등장한 지도 벌써 10년이 넘었습니다. 그리고 올해 챗GPT 대변되는 본격적인 AI시대가 개막되면서 언론도 거스를 수 없는 전환점을 맞이하고 있는데요. 데이터를 다루고 분석하는 데이터 저널리스트에게 ‘데이터’를 핵심으로 작동하는 AI의 등장은 어떤 영향을 끼치고 있을지 궁금했습니다.
Q. 데이터 저널리스트에게 AI는 유용한 도구의 탄생인가요? 위협적 존재인가요?
저는 존재의 위협이 된다고 생각하지는 않아요. 올 초에 챗GPT 광풍이 엄청났었잖아요. 저도 데이터를 다루다 보니까 챗GPT도 많이 써보게 되고 최근에는 이를 활용한 프로젝트들도 좀 하고 있는데요. 챗GPT가 기자들을 대신할 수 있을까요?라는 질문들을 많이 하시는데, 저는 절대 그럴 일은 없다고 생각하는 쪽입니다. 왜냐면 기자들은 ‘뉴스’를 전하기 때문이죠. 뉴스라는 새로운 것들. 그런데 GPT는 새로운 것들을 만들어내지는 않아요. 취재를 하고 확인하는 과정을 거치지 않는 거죠. 엄밀하고 정확하게, 저널리즘에 충실한 그런 기사를 만들어 내는 건 결국 사람의 영역인 것 같아요. 

하지만 취재 과정에서 도움을 받을 수 있는 영역은 AI에서 정말 많아진 것 같아요. 결국 AI라는 것은 데이터를 학습시켜서 우리가 원하고자 하는 것을 얻어내는 거잖아요. 저는 데이터를 다루는 사람이고요. 그런 생각으로 지금 AI를 활용한 프로젝트를 몇 개 기획 중입니다. 그것 중 하나가, 매년 공직자 재산 데이터를 PDF형태로 정부가 공개를 하는데요. 저는 그걸 매년 데이터를 DB화 시키거든요? 저도 가지고 있는 데이터가 쌓이고 있는데 매번 똑같은 작업과 분석을 하는 게 조금 비효율적이라고 생각이 들 때가 있어요. 그러면 이런 부분들을 AI에 학습시켜서 제가 필요한 것들을 물어보면 답을 해줄 수 있게 한다든지, 도움을 받고 싶은 부분은 분명히 있죠. AI기술은 기자들이 어떻게 기획하고 접근하는지에 따라 도움받을 수 있는 것들은 다양해질 것 같아요. 
Q. AI를 활용한 프로젝트를 기획 중이라고 하셨는데요. 짧게 더 소개해 주실 만한 게 있을까요?
네. 곧 출시가 될 거지만 현재 ‘폴리스코어’라는 서비스를 만들고 있고요. 그 서비스는 정치인들의 최근 이슈를 GPT 기반으로 요약해 주는 서비스입니다. 이게 무슨 말이냐면, 우리는 너무 많은 정치인들의 이슈가 쏟아지는 시대에 살고 있잖아요. 대부분 뉴스를 포털에서 소화하긴 하겠지만 내가 보는 하나의 뉴스만을 가지고 어떤 정보를 이해한다는 것은 좀 위험할 수 있다고 생각했거든요. 그래서 어떤 정치인의 모든 뉴스를 다 모아서 이를 우리가 좀 요약해서 전달해 주면 어떨까?라는 생각에 데이터 분석 업체인 ‘언더스코어’와 함께 정치인 이슈 요약 서비스인 ‘폴리스코어’를 막바지 개발중에 있습니다. 예를 들어 ‘지금 대통령의 이슈가 뭐야’?라고 물어보면 윤석열 대통령과 관련된 이슈들을 깔끔하게 대답해 주는 서비스입니다.
Q. 챗GPT를 비롯한 생성형 AI 검색 엔진들은 이슈 민감도 때문에 정치 이슈에는 답하지 못하는 경우가 많은데요. 이 부분이 언론의 역할이라고 보시는 건가요?
GPT의 가장 큰 한계는 소위 말하는 ‘할루시네이션’, 환각 현상이죠. 무엇을 물었을 때 잘못된 답변을 너무 당당하게 말을 해주기도 하잖아요. 그래서 언론사에서, 저널리즘에서 AI를 쓴다고 했을 때 저는 가장 크게 신경 써야 하는 부분이 할루시네이션을 없애고 정말 정치인들의 이슈를 가장 사실에 가깝게 말해줘야 한다고 생각했고, 그게 언론에서 AI를 다룰 때의 핵심인 것 같아요. 언론은 절대 거짓말을 하면 안 되니까요. 그 부분에 대한 고민을 굉장히 많이 했고, 할루시네이션을 제거하는 기술들을 많이 개발했습니다.
‘초거대 AI의 등장이 나의 직업, 특정한 직업을 대체할 것인가?’라는 두려운 질문은 여전히 우리 앞에 놓여 있습니다. 하지만 그에 대한 답을 찾는 중에 우리에게 빠져서는 안 되는 질문은 “내 직업에서 AI를 어떻게 활용할 수 있을 것인가” 일 겁니다. 이에 대한 배여운 기자의 생각은 아래와 같았습니다. 

“저는 개인적으로 다양한 산업에서 기술이 항상 마지막에 문을 넘는 게 언론이라고 생각하거든요. 그런데 지금 AI라는 하는 기술은 이제 점점 언론의 문을, 담을 넘고 있는 것 같아요. 이게 기회일 수 있다는 생각이 들어요. AI의 재료는 결국 데이터잖아요? 그래서 기존의 데이터 저널리즘의 모델을 넘어서 더 고도화시키고 싶다는 생각을 하고 있습니다. 또 SBS도 그간의 뉴스 속 텍스트, 영상, 음성과 같은 다양한 데이터들이 많이 쌓여있는데, 이를 어떻게 AI에 활용하고 접목할 수 있을지 어떤 여지가 있는지 그 부분에 기여할 수 있도록 하고 싶어요.” 

AI라는 굉장히 가능성이 높고 유용할 수 있는 도구를 어떻게 활용해 새로운 산업과 가치를 만들어 나갈지 머리를 맞댄 공론의 장이 반드시 필요한 때입니다. 
(글: 최예진 작가 sdf@sbs.co.kr)
SDF 다이어리는 SDF 참가자 중 수신 동의하신 분들과 SDF 다이어리를 구독한 분들께 발송되었습니다. 
일주일에 한 번 (수요일에) 만나요! 

📬 SDF 다이어리에서 나눈 지난 이야기
📭 구독 추천은 이 링크(https://page.stibee.com/subscriptions/67025)를 복사해서 전달해주세요.
📪  수신거부를 원하신다면 여기를 눌러주세요.
SDF DIARY 를 만드는 사람들
이정애 기자 : 다양한 사람들이 머리를 맞대고 마음을 모으면 해결하지 못하는 문제는 없다 믿으며 SBS D포럼을 총괄 기획해 오고 있습니다. 사회부, 국제부, 경제부, 시사고발프로그램 ‘뉴스추적’ 등을 거쳤으며 2005년부터 ‘미래부’에서 기술과 미디어의 변화, 그리고 보다 나은 세상을 위해 어떻게 다르게 같이 살아가야 할 지 고민해 오고 있습니다.

김지성 기자 : 3년간 베이징에서 특파원을 지내며 거대 경제, 핀테크, 빅브라더, 모순, 그리고 인간애를 떠올렸습니다. 앞서 사회부, 정치부, 탐사보도부 등을 거쳤습니다. 우리의 미래와 화두에 대해 더 고민하고자 합니다.

이혜미 기자 :  2008년부터 경제부, 사회부, 뉴미디어 분야에서 취재하고 기사를 써왔습니다. '번아웃'을 경계하고 일상 속 소소한 것에서 즐거움을 찾으며 살고 있습니다.

김민정 기자 : 알아주는 SF 덕후입니다. 디지털 기기의 노예의 하나로 살아가고 있으며 기술의 변화가 인간의 뇌와 내면, 그리고 사회 제도에 끼치는 영향에 큰 관심을 갖고 있습니다. 이 문제를 미래팀에서 구독자님들과 함께 고민해보고 싶습니다. 2014년부터 기자생활을 시작해 그동안 사건, 법조, 교육, 탐사보도부, 정당, 통일·외교 분야의 건조한 기사를 주로 썼습니다.

최예진 작가 : 시사, 뉴스, 선거 방송 등 다양한 프로그램들을 경험했고 2018년부터 D포럼을 기획‧구성하고 있습니다. 지식 포럼을 조금 더 대중 친화적으로, ‘가까이 와닿는’ 포럼으로 만들고 싶습니다. 

최성락 피디 : 오늘에 안주하지 말고 내일을 요리하자! SDF의 도전에 깊은 맛을 불어넣고있는 PD입니다.

최유진 작가 : 경계를 두지 않고 다양한 분야에 관심 많은 작가입니다. 함께 만들어 가는 것에 큰 성취감을 느끼고, 모두가 행복한 세상을 꿈꿉니다.  SBS D 포럼을 만들며 배워나가는 새로운 경험과 생각을 유익한 콘텐츠로 담아내고 싶습니다.

박고은 작가 : 사람으로 위로가 되지 않는 날 미디어를 통해 위로를 받았고, 그 위로를 나누고자 작가가 됐습니다. SDF를 통해 당신의 위로가 되겠습니다.

박준석 프로그램 매니저 : 다양성, 꿈, 데이터, 민주주의, 존엄성을 화두로 깨어있는 개인들에게 다가가고 있는 SBS D포럼을 진심으로 응원하며 팀원들과 함께 행복을 주는 콘텐츠를 만들어가고 있습니다. SBS D포럼이 새로운 콘텐츠 플랫폼으로 한걸음씩 잘 진화해 나가기를 기원하고 있으며, 특히 글로벌하게도 그 선한 영향력을 잘 이어갈 수 있도록 관심을 기울이고 노력하고 있습니다.

임세종 촬영감독 : 현재 SDF 팀의 촬영 감독을 맡고 있습니다. 사람들과 협업을 중요시하는 프리랜서로 다양한 활동을 하고 있습니다. 

신소희 아트디렉터 : SDF 디자인을 담당하고 있습니다. 다양한 공감이 세상을 바꾼다고 생각합니다. 제 손이 닿은 곳에서도 공감과 에너지가 전달되길 바라는 마음으로 임하고 있습니다.

송현주 마케터 : SDF의 SNS를 관리하고 있습니다. 다양한 채널과 콘텐츠로 더 많은 분들과 함께 SDF의 지식을 공유하고 싶습니다.

미래를 여는 담대한 도전 SBS SDF  │ sdf@sbs.co.kr 
서울시 양천구 목동서로 161 SBS방송센터 보도본부 논설위원실 미래팀
수신거부 Unsubscribe

Copyright © 2021 SBS All rights reserved