인공지능이 위협하는 프라이버시 😶 이 레터가 깨져보인다면? 웹에서 보기! 지금을 읽고 싶은 사람들의 미디어 이야기, 어거스트 어거스트는 현재 구독자분들이 더 읽기 편하도록 구성이나 디자인을 바꾸고 있어요. 혹시 어거스트를 읽으면서 불편하거나 좋았던 점을 알려주시겠어요? 💖 참여하신 분들께는 추첨을 통해 스타벅스 기프티콘을 드립니다! 💖 오늘의 레터와는 별개로 어거스트 전반에 대한 설문이랍니다 :) 👋 오늘의 에디터 : SAT 장희수 인공지능 산업의 권력과 욕망을 연구하는 에디터입니다! 왜 인공지능은 프라이버시를 위협할까요? 단순히 데이터의 물리적 증가 때문만은 아닙니다. 오늘은 왜 개인정보 이용 동의를 골자로 하는 현행 개인정보 보호법이 인공지능 시대에 더 이상 우리를 보호할 수 없는지, 익명화/비식별화에 관한 약속이 왜 이제는 부질없는지, 왜 이에 대해 더 많은 고민과 논의가 필요한지에 대해서 이야기해볼까요. 🙅♀️ PART. 01 개인정보 이용 동의, 이제는 시대에 뒤처진 발상 현대 사회에서 개인정보를 보호 제도의 핵심은 국가를 막론하고 ‘개인정보 이용 동의’입니다. 우리나라의 경우, 개인정보보호법은 “개인정보를 수집할 때는 정보주체의 동의를 받아야 하며, 수집・이용 목적, 수집 항목, 보유 및 이용 기간, 동의 거부권 등을 알려야 한다”라고 명문화되어 있어요. 즉, 개인정보 보호를 위해서는 개인(혹은 정보주체)에게 개인정보를 통제할 수 있는 법적인 힘을 주어야 한다는 믿음이 내재되어 있습니다. 여태까지 이러한 믿음은 어느 정도 현실적이었어요. 인터넷의 시대가 도래하기 전까지는 개인이 제공하지 않은 개인정보를 얻기란 쉬운 일이 아니었으니까요. 그러나 디지털 시대에 들어서 개인정보 이용 동의를 핵심으로 하는 개인정보보호 제도는 그 목적을 다하지 못하고 있어요. 모르는 사이에도 다양한 정보가 실시간으로 수집・저장되기 때문에, 개인은 이제 자신에게서 어떤 정보가 수집되고 있는지를 일일이 알 수 없는 상태가 되었습니다. 그리고 이러한 현상을 이미 너무나 잘 알고 있는 기업들은 개인의 동의를 간주하고 일단 수집하는 경우도 많습니다. “로그인과 동시에 개인정보 이용에 동의한 것으로 간주합니다.” 어디선가 본 적 있는, 익숙한 문구 아닌가요? 동의가 기본값이 되었기 때문에 개인정보 이용에 비동의하기 위해서는 더 복잡한 절차를 거쳐야 합니다. (이렇게 이용자의 의도와 무관하게 기업이 원하는 방식의 행동을 유도하는 디자인인 다크패턴에 관해서는 이전 어거스트 레터에서도 한 번 다룬 적이 있어요.) 즉, 인터넷과 앱과 사물인터넷의 시대가 도래해버린 지금, 사람들은 자신들이 동의했는지 안 했는지도 모를 수많은 개인정보를 수집당하고 이용당하고 있습니다. 인공지능 기술의 급격한 발전은 이러한 상황을 더욱 악화시키고 있습니다. 개인정보 이용 동의는 보통 개인정보로 해당 정보 주체를 역추적할 수 없도록 하는 ‘익명화’ 혹은 ‘비식별화’의 약속과 함께 오는데요. 인공지능 산업의 발전으로 이 익명화/비식별화의 약속이 점점 지키기 어려워지고 있어요. 그리고 정부와 기업이 이에 대해 적극적으로 대중에게 알리고 있지 않은 것 같아 많이 아쉽습니다. 정말 특정 개인을 알아볼 수 없을까요? (출처: 인터비즈) 왜 인공지능과 빅데이터의 시대에 익명화/비식별화가 쉽게 잠금해제될 수 있는지에 관해 Yves-Alexandre de Montjoye 연구팀이 세 가지 이유를 든 바 있습니다. 첫째, 이제 상호참조할 수 있는 데이터의 수와 폭이 기하급수적으로 증가했습니다. 개개의 자료 집합이 익명화 처리가 되더라도, 여러 자료 집합을 겹치고 겹치다 보면 한 사람을 특정할 수 있다는 거죠. 둘째로 데이터의 종류 역시 너무나 풍부해졌어요. 데이터 종류가 풍부해질수록 위에서 말한 상호참조의 과정이 더 쉬워집니다. 마지막으로, 기존의 자료집합에 적용된 익명화/비식별화 알고리즘을 이겨낼 수 있는 인공지능 알고리즘이 점점 더 많이 개발되고 있어요. 기술발전의 양면인 셈이죠. 👁 👁 PART. 02 보이지 않는 것까지 보는 메타데이터의 시대 최근의 머신러닝과 딥러닝 기술은 메타데이터의 시대를 열었어요. 이제는 데이터에서 알 수 있는 정보의 범위가 원래 자료 수집 당시 의도했던 범위를 넘어서게 되었습니다. 예를 들어, 한 달간의 위치이동 정보에 대해서만 이용자가 동의하여 수집했다고 하더라도, 시간대별 이동경로나 패턴을 이용해 연령, 소득 수준, 학력 등에 대해 유추할 수 있게 되었습니다. 이미 타깃 광고 때문에 연령, 사회 소득계층, 종교인 등을 특정하는 인공지능 알고리즘이 무수하게 많이 개발되었거든요. 즉, 위치정보 이외의 정보를 수집하지 않았더라도 다른 데이터와 알고리즘을 이용해 수집되지 않은 데이터까지 유추할 수 있는 거죠. 생각해보면, 우리도 카카오톡 메시지 말투만 보고도 대충 연령대와 특정 커뮤니티 이용 여부 등을 어느 정도 유추할 수 있잖아요? 굳이 이름이나 나이가 적혀있지 않아도, 우리가 특정 집단들에 대해 가지고 있는 정보를 이용해 새로운 정보인 ‘카카오톡 메시지 내용’과 연계해서 보이지 않는 정보까지도 유추하는 거죠. 어마어마하게 축적한 데이터와 이를 가공할 수 있는 인공지능 기술의 발전으로 기업들 역시 이런 유추를 너무나 손쉽게 할 수 있게 됐어요. 우리 같은 개인은 유추하더라도 직접적인 피해를 줄 수 없어 크게 문제되지 않지만, 기업들이 유추하게 되면서 직간접적으로 개인이 피해볼 수 있는 상황이 많아졌어요. 예컨대, 여러분을 채용하려는 기업에서 이력서에 적지 않은 성별, 종교, 인종, 병력에 관한 정보를 알아내어 불이익을 준다면 정말 황당하겠죠. 연령대별 페이스북 게시물의 예 (출처: gae9.com) FOIA(Freedom of Information Act) 요청에 의해서 뉴욕시티택시와 동업 조합원이 2013년의 택시 이동 데이터를 공개한 바 있습니다. 이동 날짜, 탑승과 하차 지점, 위치, 이용자 수 등의 정보를 포함한 자료였는데요. 택시 라이센스 번호는 모두 비식별화되어 있었지만, 사람들은 소셜미디어의 위치정보데이터와 인터넷에서 접근 가능한 다른 메타데이터를 이용해 개인식별정보를 유추할 수 있었어요. 예컨대, 유명 연예인의 경우 팬들이 연예인이 찍힌 사진, 트위터에서 보이는 게시글 작성 위치 등을 이 뉴욕택시 데이터와 연계해 연예인들의 이동 경로를 구현해낼 수 있었습니다. 심지어는 어떤 연예인이 스트립 클럽에 가는지도 알아낼 수 있었어요. 이쯤 되면 그냥 데이터에 이름이 포함되어있는 것 같은걸요. (출처: https://agkn.wordpress.com/) 이에 그치지 않고 사람들은 또한 해당 택시기사가 무슬림인지 아닌지도 꽤 정확하게 알아낼 수 있었어요. 이 데이터는 택시기사의 차량 번호도, 택시 등록번호도, 이름도, 사진도 연계되지 않은 비식별화된 데이터였는데도 말이에요. 한 해 동안 무슬림 택시기사들은 특정 시간에 주차를 하고, 씻고, 기도했기 때문에, 각 택시의 위치정보를 통해 어느 시간대에 얼마나 정지해 있었는지에 기반해 택시기사의 종교를 유추한 거죠. 이외에도 택시기사의 주소와 소득수준까지도 유추할 수 있었다고 합니다. 프라이버시, 개인정보 보호를 생각할 시간도 없이 인공지능 기술이 너무 빨리 발전하고 있어요. 인공지능 산업에서 보이는 “인공지능 산업이 아직 초창기이고 너무나 빠른 속도로 변하고 있기” 때문에 “윤리와 이용자 보호를 모두 생각하다가는 다른 기업에 밀릴 수 있다”는 태도도 한 몫하고요. 정부도 여러분의 데이터를 더 수집하고 이용해야 한다는 입장이기 때문에, 일단 기술의 발전에 투자를 하는 일에 더 급급해보여요. 인공지능 기술이 사람과 사회에 미치는 영향력의 크기에 비해 관련 논의가 폭이 깊지 않고 애매모호해서 실생활에 도움이 되는 방향으로 이뤄지고 있지 않는 것 같아 안타깝습니다. 결론은 이거예요. 기업과 정부가 “개인정보 이용에 동의해주세요. 여러분의 개인정보는 비식별화될 것입니다.”라고만 말하는 이면에 있는 진실은 “우리는 여러분의 데이터에 이름을 넣지 않을 거고 비식별화처리도 할 거지만, 당신의 데이터는 언제든 인터넷에 있는 다른 데이터와 연계되어 여러분이 식별될 수도 있습니다!”라는 것. 프라이버시를 연구하는 학계에서는 과거에 개발되었던 프라이버시 및 개인정보 보호를 위한 장치들이 점점 더 무용해질 것이라 예측하고, 아예 개인정보를 생각하는 패러다임을 바꾸지 않으면 안 된다고 경고하고 있어요. 그래서 프라이버시의 개념은 지금 어느 때보다도 모호하고, 관련 연구는 어느 때보다도 학계에서 논의가 활발하기도 합니다. 스스로를 지키기 너무 어려운 인공지능 시대, 개인정보 보호와 프라이버시에 대한 여러분의 생각은 어떤가요? 💭 오늘의 콘텐츠 추천 에디터 ‹SAT 장희수›의 코멘트 여러분… 저 오늘부터 중국어 열심히 하려고요. 중국어가 이렇게 달콤할 일인가? 제가 최근에 노동요로 듣고 있는 BigYear大年의 노래 하나를 소개해봅니다! 나만 알고 있을 수 엄써! 음색도 좋고, 트렌디하고, 달달한 팝송 같은 곡을 많이 발표해서 이미 한국에도 팬 층이 두터운 중국 아티스트인데요. 글쓰거나 코딩할 때 들으면 완전 꿀! 에디터 ‹구현모›의 코멘트 코로나 이후 조직 문화에 대한 관심이 커졌습니다. 일방적으로 해외 조직 문화를 찬양하는 기사와 영상은 많았지만, 수평 문화의 본질에 대해 깊게 논하는 영상은 부족했습니다. 수평 문화를 위해 직급을 없애거나 영어 이름을 쓰는 여러 기업들이 밟을 수 있는 함정에 대해 논하는 영상입니다. 정보 장벽을 없애고, 모두에게 투명하게 정보와 이슈가 공유되는 올바른 조직이 더 많아지길 바랍니다. 어거스트는 현재 구독자분들이 더 읽기 편하도록 구성이나 디자인을 바꾸고 있어요. 혹시 어거스트를 읽으면서 불편하거나 좋았던 점을 알려주시겠어요? 💖 참여하신 분들께는 추첨을 통해 스타벅스 기프티콘을 드립니다! 💖 오늘의 레터와는 별개로 어거스트 전반에 대한 설문이랍니다 :) 오늘 글을 피드백 해주세요! Copyright © AUGUST All rights reserved. 수신거부 |