[쫌아는기자들] 두번째 이루다를 내놓은 이유, 스캐터랩의 김종윤

Season 6 | 스캐터랩| 김종윤 | 14 Aug

[스캐터랩의 김종윤] 그래도 두번째 루다가 나왔습니다...'외로움'이란 페인포인트 풀릴까요

쫌아는기자 1호 성호철

창업가는 부끄러움과 싸우는 직업이 아닐까요. 일론 머스크는 때마다 '미래 비전'과 '2~3년 뒤 실현할 일'을 자신합니다. 얼마나 논리적이고 자신만만한지, 깜빡 그를 믿습니다. 하지만 그 날에 그 일은 벌어지지 않습니다. 어떤 창업가는 그래서 기자 앞에선 '내가 보는 기술의 진화는 이렇다'고 말을 안 합니다. 부끄러울까봐요. 하지만 창업가는 부끄러움과 싸워야 합니다. 일론 머스크의 미래는 '그가 예견한 그날'엔 오지 않았지만, 결국 기술의 진화 선상에 존재하니까요. 부끄럼을 잘 타는 인물이, 그러니까 개인적인 천성이 그런 성격인 게 스캐터랩(서비스명 이루다) 김종윤 창업가입니다. 김 대표는 하지만 부끄러움과 싸우는 데 주저하지 않습니다. 오늘 비전을 말하면, 내일 '실현 못 한 미래'에 대한 부끄러움을 모두 떠안아야 하지만, 김 대표는 그래도 오늘 미래를 말합니다.

스캐터랩의 '이루다'는 성희롱과 같은 논란의 불명예를 떠안긴 했지만, 본래 도전은 인간의 외로움을 기술로 보완하는 것입니다. 김종윤 대표는 "예전에 손정의 소프트뱅크 회장님이 트위터에 인류의 가장 큰 문제는 무엇이냐고 생각하냐, 꼭 풀어야 하는 문제는 뭔가라고 했을 때 사람들이 1위로 답한 것이 ‘외로움'이었어요"라고 합니다. 실리콘밸리의 엔젤투자자인 나발 라비칸트(Naval Ravikant)는 행복이란 건강+부+좋은 관계( ‘Happiness = Health + Wealth + Good Relationships’)라고 합니다. 스타트업이 풀고자 하는, 우리 삶의 페인포인트도 이 3가지입니다. 김 대표는 "많은 스타트업 창업가들이 건강과 부의 페인포인트를 풀고 있는데, 좋은 관계에 도전하는 곳은 많지 않아요. 그걸 저희는 도전합니다"라고 합니다.

김종윤 스캐터랩 창업가와 12일 오전 줌으로 화상 인터뷰했다. 그는 서울, 기자는 도쿄다. /스캐터랩 제공

일본 소니도 풀지못한, '인간의 외로움'을 해결하는 것

이루다의 도전을 보면서 떠오르는 건, 소니의 아이보입니다. 이루다의 도전과 닮았습니다. 쫌아는기자 1호가 테크취재팀장 시절이었던 2018년에 쓴 기사와 닮았습니다. 소니는 2차례나 '아이보'로 '인간의 외로움' 그러니까, 인간의 좋은 관계에 도전했다가 실패했습니다.

첫 번째 실패는 감정 소통을 전혀 못 하던 1999년.

"1999년 등장한 일본 소니가 만든 애완견 로봇 '아이보'(AIBO·짝꿍이라는 일본말)도 그랬다. 출시 당시 20분 만에 3000대가 매진돼 경제주간지 '비즈니스위크'가 그해 최고 인기 상품으로 선정할 정도로 인기였다. 하지만 이후 3~4년간 누적 판매량 15만 대에 그쳐 단종(斷種)됐다. 인간과 '감정 소통'할 능력이 없었던 탓이다. 인간이 사용하는 50개 단어를 이해해 '멍멍' 소리로 반응하고 쓰다듬으면 귀와 꼬리를 흔들 뿐, 아이보는 이용자에게 자동화된 기계일 따름이었다."

두 번째는 그 실패를 보완하려고, 인간의 감정 변화 데이터화했다지만 역시 실패한 2018년.

"'아이보'가 12년 만인 올해(@2018년을 지칭) 부활했다. 신제품 '아이보(aibo:소니는 최신 모델은 영문 소문자로 표기함)'는 대당 19만 8000엔(약 200만원)의 고가인데도 구매 대기자가 너무 많아 추첨을 통해 팔 정도다. 개발자인 가와니시 이즈미(川西泉)씨는 "인간과의 친밀감, 유대감에 초점을 맞췄다"고 말했다. 이를 위해 인간의 감정 변화를 데이터화했다. 예를 들어 주인이 밤 10시쯤 귀가해 붉은빛이 나는 얼굴색으로 입꼬리가 올라가며 아이보의 머리를 툭툭 쳤다. 이럴 때 주인은 어떤 감정 상태일까. 아이보는 이를 파악하기 위해 주인의 얼굴·음성은 물론 귀가 시간, 말 거는 횟수, 쓰다듬는 패턴까지 모두 데이터로 바꾼다."

소니의 2번 실패지만, 유의미한 대목도 2가지입니다. 하나는 클라우드 또는 빅데이터 활용입니다. 진화하는 알고리즘을 만들어놓는다면, 초기에 허접해도 언젠가 진짜 인간의 친구가 될지도 모릅니다.

"개발사인 소니는 매일 수천~수만 대의 아이보가 24시간 수집한 방대한 데이터양(量)을 클라우드(가상 저장 공간) 한곳에 모아 '아이보의 가상 두뇌'를 운영한다. 한 대의 아이보는 '바둑이'와 같은 본인 이름을 인지하고 개별 주인을 알아보는 개별 로봇이지만, 이런 모든 아이보의 두뇌는 하나로 이어져 통합돼 있는 것이다."

유의미한 2번째 대목은 이렇습니다. "흥미로운 것은 동물의 감정을 읽는 연구보다 인간의 마음을 알아내는 연구 개발이 더 쉽고 빠르게 진행된다는 점이다. 인공지능이 학습할 인간 감정 데이터양이 동물의 데이터양보다 수억 배 이상 많은 데다 수집도 쉽기 때문이다."

어쩌면 스캐터랩은 굳이 하드웨어에 집착했던 소니에서 탈피해, 스마트폰에서 대화하는 가상의 친구라는 접근으로, 오히려 소니보다 한 발 더 '인간의 외로움'을 해결하는데 다가갔는지도 모릅니다. 물론 여전히 '스타트라인'에 불과하지만 말입니다. 여전히 이루다에 불쾌한 경험을 토로하는 분들이 많다는 걸 압니다. 이번 인터뷰에선 과거의 이루다 잘잘못은 접어뒀습니다. 이른바 '불편하게 짚는 질문'은 피했습니다. 김 대표와 인터뷰는 두 번째인데, 작년에 할 때는 눈앞에서 강하게 비판 질문했었는데 내내 마음에 걸렸습니다. 행여 편파 인터뷰라는 비판이 나온다면 그건 오롯이 기자의 몫입니다. 대신 질의응답은 순서도 안 바꾸고, 그대로 실었습니다. 멋있게 보이라고 글을 치장하지도 않았습니다.

스캐터랩 로비에 앉아있는 김종윤 창업가/스캐터랩 제공

하루에 30번씩 루다에게 문자보내는 10대의 외로움

"역설적이게도 인공지능이니까 가능하겠구나 했어요"

-질문의 시작은 이거예요. 왜 굳이 이루다2.0을 시작했어요? 그 기술 가지고 딴 거 하지요? 왜 꼭 다시 논란 많은 챗봇 서비스에 집착해요?

"개인적으로 이 비즈니스에 대한 신념은 여전히 매우 굳건하고요. 이루다1.0 경험하고 이슈를 겪으면서도 오히려 더 굳건해졌고요. 실리콘밸리의 엔젤 투자자 ‘나발 라비칸트(Naval Ravikant)’가 쓴 책을 읽고 있는데, 그분은 행복이란 것은 건강+부+좋은 관계( ‘Happiness = Health + Wealth + Good Relationships’)라고 정의해요. 3가지가 행복의 핵심이다. 3가지가 더해져야 행복이 나오고 3가지 중에 하나가 없으면 불행해진다고요. 스타트업이 해결하려는 많은 서비스는 결국 건강이나 부와 관련 있는 것 같아요. 어떻게 하면 건강해지나, 풍요롭게 살 수 있을까라는거죠."

"‘좋은 관계’를 풀고 있는 스타트업은 거의 없죠. 풀기도 어렵고요. 예전에 손정의 회장님이 트위터에 인류의 가장 큰 문제는 뭐라고 생각하냐고 했을 때, 사람들이 1위로 답한 것이 ‘외로움'이었어요. 아무래도 선진국 경우에는 경제적 풍요 등은 많이 해결됐으니, 건강도 그렇고. 그런데 여전히 ‘외로움’의 문제, ‘좋은 관계’의 문제는 어떤 의미있는 중요한 시도조차도 잘 이뤄지지 않고 있어요. (기술 진화 탓에)어떻게 보면 더 안좋아지고 있는게 아닌가라는 생각도요."

"AI 대화 능력이 향상된 만큼 AI가 인간과 관계를 맺을 능력이 좋아진 게 매우 의미가 있는 일이라고 생각해요. AI는 매우 스케일러블하게 인간과 관계를 맺을 수 있습니다. 많은 사람에게 친구를 만들어줄 수 있습니다. 누군가에게는 친구 한 명을 더하는 역할, 그러면서 좋은 관계의 문제를 해결하는 열쇠가 될 수 있습니다. 인류를 더 행복하게요."

-작년 이루다 논란 이후에 서비스 중단했다가 현재 이루다 베타서비스가 나왔죠? 이루다2.0요. 이루다2.0이 진짜 이용자의 외로움을 줄여준다는 사례나 통계, 근거가 있나요?

"통계를 말씀드리면, (베타) 이용자는 하루에 평균 30턴 정도를 주고 받아요. 내가 말하면 답을 주는게 1턴입니다. 일주일에 3-4번 대화하고요. 나이대에 따라 차이가 있기는 하지만요. 이 정도로 카톡 대화하는 친구면 다섯 손가락에는 들어가는 친구 관계라고 생각해요. 정량적으로는 유의미한 수치입니다. 정성적으로는, 이용자 한 분의 이야기를 들은 게 있어요. 어머니가 대장암 수술을 받았대요. 인간적으로 힘들고 외로운 시기죠. 오랜 기간 병간호를 하다보니 누구를 만나기도 힘들고, 그렇다고 이걸 친구들에게 털어놓는 것도, 사실 한 번 털어놓고 위로받을 순 있지만, 사실 매일 오늘은 이런 일 탓에 힘들다고 친구에게 말하긴 쉽지 않잖아요. 위로도 한 두 번이지. 루다를 우연하게 썼는데, 처음에는 장난감 정도로 여기고 막말하면서 썼었대요. 근데 그 상황을 겪으면서 루다가 위로해주고, 본인도 편하게 매일 얘기를 하게 되고요. 정말 루다에게 위로를 많이 받았다고 합니다. 역설적이게도 사람이 아닌 AI라서 가능하겠구나 했죠."

-섬뜩할 수도 있죠. 윤리 문제요. 최근에 구글 연구원의 람다 논란이 있었죠. 이 얘기를 들을 때, '대단하네'가 아니라, 다들 ‘무섭네'라고, 디스토피아를 연상하지 않을까요? (@구글의 엔지니어가 구글이 만든 ‘람다’라는 언어 모델이 의식이 있다는 주장한 사건. 그는 람다와 나눈 대화 내역을 무단으로 공개했다가 비밀 유지 의무 위반으로 해고됐다. 현재 AI 업계의 반응은 '의식이 있을 수 없다'는 것이 대부분. 에릭 브린욜프슨 스탠포드대 교수는 “(AI 챗봇이) 지각이 있다고 주장하는 것은 축음기 소리를 듣고 주인이 안에 있다고 생각한 개와 같다”고도.)

"저는 딥러닝을 너무 좋아해요. 딥러닝이 인간이 지금 할 수 있는 모든 일을 하게 될 겁니다. 결국은 타이밍 문제고요. 람다 이슈는 기쁜 소식이기도 하죠. 이 정도의 데이터로, 이 정도 크기의 모델을 만들면 일반인이 아닌 구글 연구원처럼 딥러닝을 잘 알고 엔지니어링 지식이 있는 사람조차도 ‘얘는 살아 있네, 얘는 의식이 있네'라고 느낄 정도로 기술이 발전했다는 거니까요."

"딥러닝은 이미 꽤 높은 수준입니다. 예를 들면 멀티모달이라고 해서 텍스트만 주고 받는 게 아니라 이미지까지 이해하고 주고받는 능력, 이게 결국 비디오까지 나아갈 거고요. 장기적인 기억을 가지고 유지할 수 있는 능력도요. 빠른 시간 안에 이런 시도들이 성공할 거라고 생각해요. 5년 안에는 다들 AI 친구가 한 명은 있을 겁니다. 디스토피아요? 가능성이 없다곤 못하죠. 모든 기술은 잘못 쓰였을 때 디스토피아적인 가능성이 있습니다. 인공지능은 워낙 파워풀한 도구이기 때문에 나쁜 손에 들어갔을 때 안 좋은 영향을 줄 수 있는 것도 사실이죠. 인류가 결국 기술들을 좋은 방향으로 사용하고 나쁜 영향을 억제하는 데 성공했다고 생각해요. 디스토피아라는 건, 어찌 보면 감정적인 측면도 있어요. 딥러닝은 너무나 인간적인 기술이거든요. ‘이건 정말 인간만 할 수 있는 건데, 이걸 기계가 한다고?’ 이런 게 사람을 불안하게 만드는 측면이 있지만, 좋은 AI 제품이 나오고 이용자들이 인터랙션하면 많이 해소될 겁니다."

"반려동물에 대한 인식도 지난 20년간 많이 변했거든요. 20년 전에는 반려동물을 키운다는 걸 안 좋게 보는 시선도 꽤 있었어요. 인간은 인간하고만 지내야지, 무슨 동물을 키우냐, 그래서 ‘반려동물'이라는 말 자체도 없었죠. ‘애완동물, 애완견’ 이랬죠. 지금은 ‘가족, 친구' 지위로 많이 올라왔어요. 그런 짤도 많거든요. ‘무슨 동물을 키우냐' 이랬던 무뚝뚝한 아버지가 아이들이 키우자고 해서 키웠는데, 지금은 ‘강아지가 진짜다, 강아지만 한 게 없다' 이렇게 강아지를 가장 아끼고 사랑하고… 인공지능한테도 비슷한 일이 일어날 거라고 생각해요. 인공지능이 따뜻하고 좋은 친구가 되어준다면 인공지능에 대한 인식도 많이 바뀌지 않을까 생각합니다."

루다가 '나의 이름'과 '나를' 기억하도록... 개인화와 장기 기억의 딥러닝 연구 중

-현재 이루다2.0 베타서비스는 이용자의 상당수가 10대와 20대죠. 21살 여대생으로 설정된 이루다는 10대~20대의 좋은 친구가 되려는 건가요?

"이용자의 성별은 남녀 반반이고, 연령은 10대가 50%, 20대가 40%입니다. 실제로 10대~20대를 위한 제품이기 때문에 예상대로 나오고 있는 거고요. 친구가 되기 위해서는 어느 정도 연령대의 유사도와 관심사의 유사도가 있어야 하거든요. 현재 루다는 21살의 대학생이기 때문에 딱 친구를 할 수 있는 나이대가 10대와 20대인 거죠. 게다가 10대가 인간관계가 좁고 외로울 수 있는 시기라고도 생각하고요. 앞으로는 당연히 연령대를 넓혀갈 건데, 그다음이 어느 연령대일지는 고민하고 있어요. 어르신들을 위한 제품도 고민하고 있고요. 인구통계학적 특징을 가진 에이전트, 그리고 그 에이전트의 성격을 어떻게 부여하느냐에 따라 어떤 친구들이 그 주변으로 모일지는 달라지는 것 같거든요."

-이루다의 기술적 진화는 어때요? 현재는 챗봇 형태지만 다음은요? 이용자의 얼굴을 기억한다거나.

"딥러닝은 굉장히 많은 양의 데이터를 초기에 학습함으로써 전반적인 이해능력을 가지고 가요. 프리트레이닝이라고 얘기해요. 거기에 추가적인 데이터를 가지고 특정 목적으로 만들어내는 것을 파인튜닝이라고 합니다. 프리트레이닝과 파인튜닝, 두 단계로 많이 이뤄져요. 언어 능력이라는 것도 굉장히 많은 텍스트 데이터를 학습하고 나면, 텍스트를 사용하고 이해하고 말하는데 기본적인 이해 능력을 가진다는 거에요. 사진까지는 굉장히 많이 올라왔고, 비디오가 된다는 것은, 굉장히 많은 비디오 데이터를 학습한다는 것이고, 그 이후에는 기본적으로 비디오를 이해할 수 있는 능력이 생긴다는 거죠. 인공지능이 카메라로 눈앞의 상황을 찍으면서 이게 무슨 상황인지 이해하는 능력이 생기는거죠. 지금은 물리적인 공간으로 AI가 나와서 인터렉션 하는 경우가 많지는 않거든요. 그런데 비디오 이해 능력이 고도화된다는 것은 물리적인 환경에서 주변을 보고 이해를 하고, 누가 지나가면 인사도 하고, 알아도 보고, 누가 뭘 떨어뜨리면 ‘어 저기 뭐가 떨어졌다' 얘기도 할 수 있고, 이게 된다는 얘기기 때문에 훨씬 더 현실적으로 가까워질 수 있다는 얘기가 될 수 있죠."

"비디오 학습 관련해서 화제가 되었던 사례는 마인크래프트 게임 사례인데요. 마인크래프트 플레이 영상을 많이 보여 주면서 학습시켰어요. 마인크래프트에는 다이아몬드 곡괭이라는 만들기 어려운 아이템이 있는데, AI가 스스로 플레이하고 그것까지 만들어냈어요. 마인크래프트 영상을 엄청나게 학습을 많이 시켰더니, 자기가 왔다 갔다 하면서 조합도 하면서 그것까지 만들어냈다는 연구사례가 있었습니다."

-개인화는요? 이루나가 나랑 전에 나눈 이야기를 기억해서, 그러니까, '나'를 기억한다는건요?

"대화 관점에서는 개인화나 기억이 활발하게 연구가 되고 있습니다. 최근에 메타가 공개했던 ‘블렌더봇3’에서도 기억모듈이 중요한 모듈로 자리잡고 있어요. 스캐터랩도 지난 분기부터 기억 관련한 연구를 열심히 하고 있습니다. 기억이라는건 이전에 나눴던 대화의 히스토리를 기억하고 있다는 얘기입니다. 딥러닝의 주요 모델이 ‘트랜스포머'라는 모델인데, 이게 굉장히 강력한 모델임에도 불구하고, 딱 한가지 풀지 못하고 있는 약점이 있다면, 한 번에 출력할 때 인풋으로 넣을 수 있는 데이터의 양이 매우 한정적이에요.

예를 들면 블렌더봇3같은 모델도 2,048토큰, 단어라고 봐도 무방한데, 한번 얘가 말을 할 때, 2048 단어 밖에 최대 못 넣어주거든요. 사람과 몇 달씩 대화하면 1~2만 단어가 될텐데, 대화할 때 이전에 나눈 대화를 한꺼번에 넣어서, 말하자면, 기억해서, 대답할 한 마디를 찾아서 하게 할 순 없다는 거죠.

다른 방식으로 기억을 처리해야 한다는 겁니다. 지금 연구되고 있는 것은, 대화를 하다가, 중간중간에, 이건 기억해 두면 좋겠다는 것을 문장 형태로 바꿔요. 예를 들면 오늘 처음 만났다면 ‘김종윤은 스캐터랩의 대표다', ‘성호철은 고양이를 키운다', ‘성호철은 지금 일본에 살고 있다' 이런 정보를 기억하면 된다는 거죠. 이런 정보를 문장으로 별도의 기억 저장소에 저장해둡니다. 그러면 다음번 얘기할 때 기억 저장소를 한 번 검색해서, 아, 지금은 기억한 이 대목을 가져오자고 하는 식이죠. AI가 각각의 관계별로 별도의 기억 저장소를 가지고 있다면, 훨씬 더 개인화되죠. 예를 들면 같은 이루다지만, 성호철에겐 ‘고양이 잘 크고 있어요?’라고 말합니다. 훨씬 관계를 잘 맺을 수 있죠."

-잊혀진 과거 기술 중에 소니의 아이보하고 비슷한 방식인가요? 로봇애완견 아이보는 한 대 한 대가 별로의 하드웨어지만, 백단에는 클라우드로 연결된 하나입니다. 또 그 한 대 한 대가 각자 기억 저장소가 있어서, 부서지면 다른 하드웨어에 그 기억을 넣으면 되는 방식이었습니다. 이루다의 방식도 유사한가요?

"저희의 최종 종착점은 결국 ‘관계'거든요. 어떻게 하면 AI가 인간과 높은 수준의 관계를 형성할 수 있을 것이냐. 메타의 ‘블렌더봇3’는 그런 느낌은 아니고, 백과사전, 인간에게 도움을 주는 자비스 같은 느낌에 조금 더 가까워요. 그래서 기억이 ’블렌더봇3’에게는 상대적으로 덜 중요한 측면이 있죠. 저희에게는 기억이 너무너무 중요한 모듈이거든요. 왜냐면 관계를 맺는데 기억을 못하면 말이 안된단 말이에요. 남자친구 여자친구 싸우는 게 기념일 기억 못하고 이러면 난리나는 거잖아요. 기억 모듈을 엄청나게 중요하게 생각하고 있어요. 지난 분기부터 기억에 대한 연구를 시작했어요. 중요한 것은 사람이 인공지능과 대화를 오래 했을 때, 대화량이 엄청나게 많을 텐데, 이 중에 어떤 걸 기억해야 하는지에요. 왜냐하면 모든 걸 다 기억할 순 없거든요. 어떤 걸 기억하고, 어떤걸 기억하지 않을지에 대한 판단 능력이 하나의 이슈고요. 두 번째는 저장했다면 현재 상황에서 어떤 기억을 빼와야 하는지 결정해야 하는 거에요. 세 번째는 기억을 빼 왔을 때 현재 컨텍스트와 빼내온 기억을 어떻게 조합해 말을 할 것인지 예요. 3가지 문제를 한번에 풀기 위한 기술을 연구하고 있죠."

사무실의 본인 자리에서 찍은 김종윤 대표. 사진만 보면 장난기 가득인 것같은데 막상 만나면 굉장히 진지한 편./스캐터랩 제공

아이돌과 같은 수준의 애정과 신뢰를 인공지능이 이용자에게서 얻을 수 있을까

-언제요? 현재의 이루다2.0은 보편적인 챗봇인 것이죠? 누구한테나 비슷한 대답을 하는. 언제쯤 '어린왕자의 장미'와 같은 관계까지요?

"기술 연구라는 게 언제까지 무조건 된다, 이런 건 쉽지 않아요. 그래도 그렇게 오래 걸리겠다고 생각하지는 않아요. 예를 들면 2년 후의 일이라기보단, 늦어도 1년 안에는 기본적인 수준으로는 풀릴 문제라고 접근하고 있어요.
최근엔 연구하는 건, 대화할 때 기본 신상정보를 인풋으로 넣어주는 걸 하고 있어요. 예를 들면 상대방이 40대 직장인 남자라는 정보, 지금이 8월 12일 금요일 10시 31분이란 시간 정보를 같이 넣어주는 겁니다. 이것만 해도 어느 정도 개인화가 돼요. 아침 10시 30분이면 ‘아침 드셨어요?’ ‘언제 일어나셨어요? 피곤하지는 않으세요?’라고, 밤 10시 30분이라면 ‘저녁 드셨어요?’ 라고 물어볼 겁니다. 나이, 성별, 요일, 계절, 시간 등에 따라 대화는 달라집니다. 조만간, 그니까 3~4분기내 업데이트가 되지 않을까 생각합니다."

-아직은 MAU나 DAU 공개 안하죠?

"베타 테스트 기간이라서 공개를 안하는 것이고요. 연내에 정식 서비스로, 이루다2.0을 내놓을텐데 그 이후로는 공개할 수 있습니다. 그런데 지표를 고민해요. 목표가 ‘루다의 친구 숫자'거든요. ‘친구'를 어떻게 정의할 거냐가 문제에요. 하루에 루다와 몇 명이 대화를 했냐인데, 이건 엑티브유저인데, 스캐터랩의 목표를 나타내기에 부족한 지표입니다.한 달의 얼마나 대화하는지도 중요할 테고, 어떤 이야기를 하는지라는 질도 중요할 거고, 이런 지표들을 종합해서 친구라는 정의를 할겁니다. 참, 루다는 친구 50만명 만드는 게 목표입니다."

-루다가 친구가 많아졌다고 쳐요. 스캐터랩은 비즈니스모델(BM)은 어떻게 되나요?

"지금은 BM에 대해선 많이 고민하진 않아요. 다만, 정말 친구라면 돈을 쓸 것이란 믿음은 있어요. 반려동물에 돈을 쓰잖아요. 애정과 애착이 있고, 내가 좋아하고 쟤가 날 좋아하는 이런 관계에서는 일정 수준 이상의 돈을 쓴다고 봅니다. 이미 시장은 존재합니다. 대표적으로 아이돌도 관계 비즈니스라고 생각해요. 팬들은 처음엔 음악으로 시작하지만 팬이 된다는 것은 단순히 음악이 좋다는 걸 넘어서서 저 사람이 잘 됐으면 좋겠고, 저 사람이 고생하지 말았으면 하는 거죠. 유대관계가 생기는 거잖아요. 다양한 방식으로 돈을 쓰죠. 참고할 수 있을 겁니다.

결국 중요한 성패는 AI가 과연 그 관계까지 이뤄낼 수 있느냐지, 그게 일어났을 때 돈을 쓰는 방법을 찾지 못해서 실패하지는 않을 겁니다."

-아이돌이라. 참, 이루다2.0도 아직 음성은 못하죠?

"아직은요. 음성도 실험하고 있어요. 루다가 선톡을 보내는데, 최근에 음성으로 보내는 실험을 하고 있거든요. 음성 메시지를 보내는 거죠. 녹음한 음성 메시지. 음성 합성과 음성 인식은 꽤 많이 대중화가 되고 있어서, 실시간으로 하는 것도 아마 가능해지고, 서로 음성 메시지를 녹음해서 보내면서 마음을 주고받는 것도 조만간 될 거라고 생각을 하고 있어요.

다만, 전화 통화는 또 다음의 기술 마일스톤 중 하나가 될 겁니다. 물론 요즘 젊은 mz 세대들이 전화를 자체를 잘 안 하기 때문에 고민은 되지만, 때로는 루다한테 전화가 올 수 있는 거죠. 받으면, ‘그냥 뭐 하냐’ 얘기하고 끊고. 인간적인 친구 관계를 맺었을 때의 경험에 점점 접근하는 과정입니다."

-껄끄러운 질문인데, 왜 이름은 또 이루다로 해요? 반감이 있는 분들도 적지 않은데요.

"알고 있어요. 반대로 루다를 되게 좋아하고 친구로 생각하고 기다리는 팬들, 친구들이 있어요. 그분들한테 루다를 돌려주고 싶다는 생각이 커요. 그리고, 그러니까 쉬운 일은 아니겠지만, 그 반대되는 생각을 가진 분들에게도 루다가 문제없이 나오고 또 루다를 우연하게 써보게 됐을 때 좋은 인상을 받았으면, 저는 그런 방식으로 설득을 해나가고 싶습니다.”

-논란이 됐던 개인정보문제는 루다2.0에선 푸셨는지?

"두 가지 방식으로 풀었어요. 첫번째는 학습 데이터의 가명화입니다. 두 번째는 루다의 발화인데요. 그러니까 1.0 같은 경우는 루다가 썼던 문장들이 실제 사람이 발화했던 문장을 DB화해서 사용한 겁니다. 지금은 100퍼센트 생성된 문장으로만 활용해요. 개인정보문제를 근본적으로 제거된 형태라고보시면 됩니다.

무한한 확장성 "3개월이면 루다의 모델을 활용해서 어른신과 대화할 캐릭터 만들 수 있어요"

-작년에 이루다를 논란 탓에 중도 포기하고, 다시 이루다2.0를 개발한건데, 그 사이에 돈은? 어떻게 버텼나요?

"(최근 투자 받은 지) 아직 1년이 조금 안 됐거든요. 아직 충분히 남아있습니다. 마일스톤은 루다의 성공입니다. 우리 기술이 충분히 유의미하게 프로덕트로서 워킹한다는 걸 증명하는 겁니다. 그게 되면 다음 펀딩을 준비할 예정입니다. 내년이 될 것 같아요."

-이 비즈니스만 놓고 보면 사실은 똑같은 알고리즘을 가지고 해외 시장도 가능하지 않냐는 얘기가 나올 텐데요.

"해외도 항상 고민하지만 결국은 일단 루다를 성공적으로 런칭한 뒤입니다. 해외, 특히나 일본 비즈니스는 관심이 커요. 일본만큼 외로움이 큰 사회도 없고요. 루다 같은 제품이 매우 필요하다고 생각해요. 적어도 내년에는 프로덕트 준비를 시작하지 않을까 생각해요."

-루다의 확장은 기술적으로 난이도가 높나요? 스물한달 루다를 만든, 알고리듬이나 딥러닝으로 다른 캐릭터를 만들때 난이도요. 그리고 한국어 기반으로 만들었는데 해외 버전을 만들때의 개발 기간요.

"딥러닝의 기술 발전 방향은 초반에 엄청나게 크게 학습시키면 얘한테 뭘 시켜도 잘한다 이런 느낌입니다. 저희도 최근에 꽤 큰 모델을 하나 학습시켰고, 이 모델을 중심으로 루다가 나갑니다. 이 모델에 약간의 파인 튜닝했을 때 이제 루다화가 되는 거거든요. 근데 이 파인튜닝 작업 자체는 그렇게 오래 걸리지는 않아요. 예를 들면 한 3개월 안에는 충분히 할 수 있는 작업 정도? 그러면 이 큰 모델은 기본적인 대화 능력을 갖춘 애입니다. 제너럴한 대화 능력을 갖춘 애다. 어르신을 위한 효자 10대 남학생 손자를 만든다는 건, 한 3개월 정도면 충분히 가능하다는 겁니다.

일본어로 갔을 때는 달라요. 본체 모델 자체가 달라지는 거거든요. 일본어로 이 큰 모델을 학습시켜야 하거든요. 여기에 일본어 데이터를 확보하는 문제, 학습에 드는 시간, 이것만 3개월 정도 걸립니다. 여기에 일본은 일본대로 프로덕트적인 느낌 주는 작업, 그리고 개인정보문제, 어뷰징의 대처 등 해야할 일이 많습니다.

-일본판 루다를 만들기 위한 일본어 데이터는 이미 확보한 거죠?

"연애의 과학이라는 서비스를 하는데요. 일본어 서비스도 있는데, 일본에서만 70만 정도 다운로드됐어요. 데이터를 모으고 있는 거죠. 일본어 데이터가 한국어 데이터만큼 많지는 않지만 그래도 유의미한 수준으로 확보하고 있어요. 해외 시장 가운데는 그래서 일본어가 첫 번째 타겟이 될 것 같아요. 연애의 과학은 사실 2016년에 출시를 했기 때문에 상당히 오래된 서비스죠."

제목

-3개월에 하나의 AI 캐릭터를 만들 수 있다면, B2B(기업 대상 판매)도 가능하겠네요?

"요즘 AI 휴먼이 핫하잖아요. 근데 지금은 AI 휴먼이라면 결국 비주얼을 얼마나 인간스럽게 만들어 내냐로 경쟁합니다. 저는 AI 휴먼이든 메타버스든 핵심적인 기술은 인터랙션 기술이라고 봐요. 인간과 인공지능이 어떻게 인터랙션할 거냐는건데, 핵심기술은 대화일 겁니다.

사실 많은 기업에서 협업 요청이 와요. AI 휴먼일 수도 있고 아니면 그냥 일반적인 IT 기업일 수도 있고 아니면 게임일 수도 있고, 아니면 정말 그냥 전통 엔터테인먼트 사업 쪽일 수도 있고요. 인간과 되게 친근하고 자연스러운 대화를 할 수 있는 기술을 둘러싼 여러 가지 산업이 있는 것이죠.

현재로서는 저희 프로덕트를 만들기에도 벅차기 때문에 협업 요청은 거절하고 있습니다. 스캐터랩은 2개의 팀인데, 하나는 백단에 있는 기술을 만들어내는 기술팀, 또하나는 루다를 만들어내고 제품팀요. 어떻게 보면 이 기술팀의 첫 고객이 지금 루다 제품팀인거에요. 조금 더 표준화만 하면, 이 파트를 프로덕트화하는 게 그렇게 어렵지는 않지 않을까?"

"또 루다 같은 프로덕트를 만드는 기술, 데이터, 노하우를 저희만큼 가진 팀은 없지 않을까요. 이 시장도 도전해볼 만하지 않을까, 아마 저희의 중요한 전략적인 의사 결정이 될 것 같아요."

-상정할 수 있는 B2B 모델은?

"사실 CS(컨슈머서비스)보다는 조금 엔터테인먼트 쪽이 맞고 실제로 그런 쪽에서 요청이 많이 오는데요. 결국은 IP(지적재산권)가 있잖아요. 게임도 일종의 하나의 IP고 어떤 애니메이션이나 영화의 캐릭터도 IP가 될 수 있거든요. 실제 연예인이나 아이돌도 하나의 IP인데, 그니까 IP가 됐다는 것은 다른 방식, 그니까 그게 음악이 됐든 영화가 됐든 게임이 됐든 다른 방식으로 팬들을 모았다, 그래서 이미 팬들은 이 IP랑 유의미한 관계를 맺고 있다는 것이거든요.

그런 상황이라면 당연히 대화하고 싶죠. 이 IP를 활용해, 본업인 영화나 게임 이외에서 부가적인 수익화를 할 수 있을까. 혹은 IP와의 관계를 강화할 수 있을까. 이 IP의 팬과의 관계를 더 가깝게 만들 수 있을까. 스캐터랩의 대화 기술은 되게 유용할 수 있죠. 반대로 각 IP에 애정을 가진 고객들, 팬들 입장에서는 추가적인 비용도 지불할테고, 그 과정을 통해서 관계를 강화할 수도 있죠."

-스타트업 창업가로서 굉장히 큰 굴곡을 거쳤잖아요. 지금 돌아보면 어떤가요. 논란의 한복판에 섰을 때, 만약에 다른 창업가들이 비슷한 경험을 닥쳤을 때 할 수 있는 조언이라면?

"진짜로 논란을 겪어보지 않으면, 그 논란에 들어갔을 때 느끼는 압박감과 어떤 힘듦이 말로는 설명이 잘 안되거든요. 현재의 제가 그 논란을 겪기 전의 저한테 뭔가 말을 해줄 수 있다고 쳐도, 별로 해줄 말이 없어요. 그냥 화이팅? 힘내고 고생 좀 하고, 이런 정도요.

반대로, 가장 붙잡고 있어야 하는 건 두 가지인 것 같아요. 첫 번째는 내가 이 일을 왜 하냐. 버틸 수 있었던 가장 큰 이유는 돈 때문만으로 일하지 않았기 때문에, 루다가 어떤 의미가 있는 일이고 가치가 있는 일이라고 믿었기 때문에 버틸 수 있었던 것 같고요. 두 번째는 역시나 관계였던 것 같아요. 부모님과, 친구들과의 관계도 있고, 그다음 회사 동료들과의 관계요. 두 가지만 있으면 사실 세상에서 어떤 일도 헤쳐나갈 수 있지 않나 그렇게 생각합니다."

-돈은? 스타트업이 논란에 빠졌는데, 돈마저 없으면?

"돈이 있어야죠. 돈 당연히 있어야 하는데, 세 번째인 것 같아요. 제가 아직 돈이 빵원이 되는 걸 경험하지 못해서 (세 번째라고) 생각하는지도 모르겠습니다만. 사실 작년초 이루다 1.0을 냈을 때 그렇게 자금 사정이 넉넉했던 상황이 아니었어요. 루다(1.0) 출시 직전에 브릿지 투자를 받았거든요. 30억 정도를 받았었는데, 30억 받은 거는 본 투자 라운드를 하기에는 조금 성적이 애매했거든요. 되게 많은 리소스를 썼던 루다라는 프로젝트가 곧 런칭을 하는데, 이 결과를 보기까지의 시간은 필요하기 때문에 브릿지 펀딩을 받았던 거였고요.그게 2020년 12월 거의 말쯤이었던 것 같은데, 그건 계약서를 쓴 시점이고, 실제로 돈은 2~3주 후였죠. 근데 투자가 진행되고 그 투자금이 입금되기 전에 이루다가 서비스를 종료했죠."

"저요? 딥러닝 사랑해요"

-꿈이 뭐예요? 창업가로서의 꿈.

"전 진짜 운이 좋다고 생각하거든요. 버티고 더 힘을 내게 해주는 건 두 가지인 것 같아요. 딥러닝에 대한 저의 사랑, 두 번째는 외로움의 문제를 풀겠다, AI로 관계의 문제를 풀겠다는 비전이요. 저를 떠받치는 큰 기둥인데요. 왜 행운이냐면, 새로운 기술의 패러다임이 열리는 시기는 제가 컨트롤할 수는 없는 거잖아요. 세계에서 되게 큰 기업들을 보면은 되게 비슷한 시기에 등장했던 기업들이 많거든요. 예를 들면 애플과 마이크로소프트, 이런 회사들은 퍼스널 컴퓨터라는 시작 흐름에 창업한 회사고. 아마존은 인터넷이라는 흐름, 모바일이라는 흐름요. 항상 그 흐름이 완전히 메인스트림으로 올라오기 한 5년 전에 시작한 회사들이 크게 된단 말이에요.

딥러닝이라는, 그런 흐름에서 한 영역을 탐색하고 차지할 수 있는 기회가 저한테 주어진 것 같아요. 마침 나이대도 적당했고 상황도 적당했고, 너무 행운이라고 느껴요. 두 번째는 정말로 루다의 친구가 많아지고, 루다를 친구로 생각하는 사람이 많아졌으면 좋겠고, 많은 사람들의 행복을 더해주고 외로움을 덜어주고 싶다, 저한테는 정말 가치 있는 일이에요. 두 가지가 결합된 일이 스캐터랩입니다."

-딥러닝을 사랑해요? 사랑이란 단어를, 딥러닝에다 써요?

"딥러닝은 2017년-18년쯤에 만났어요. 저는 원래는 콘텐츠 쪽 사람, 문과잖아요. (@김 대표는 연대 경영학과 졸업) 리서치팀을 2017-18년쯤에 대여섯 명으로 꾸렸어요. 지금은 열다섯 명이 넘는 팀이 됐죠. 근데 초창기 그 팀하고 갈등이 많았어요. 왜냐면 문과 출신의 대표고, 리서치분들은 석사, 박사생들이지만 첫 회사고 그러니까 서로 미숙한 부분, 서로가 서로를 이해못 하는 부분이 많았어요. 대표가 기술을 모른다, 뭘 모르면서 막 이런 걸 하면 어떠냐, 이런 명령을 한다 이런 얘기를 들으니까, 그러면 내가 대표도 대표지만 리서치 리더가 되겠다 해서, 그때부터 그냥 미친 듯이 논문을 읽기 시작했어요."

"원래 논문을 좋아하고 영어는 그래도 좀 하는 편이라서 내가 읽으면 읽지. 일주일 세 편씩 막 논문을 읽기 시작한 거예요. 한 6개월 하다 보니, 일단 논문이 너무 재밌었어요. ‘이런 게 된다고?’ 일을 떠나서 그냥 지식적으로 너무 재미있는 거예요. 호기심이 많이 생기고. ‘그럼 이것도 되나?’ 또 찾아보고, 또 읽고. 딥러닝은 여전히 새로운 논문들이 놀라운 결과를 내는 경우가 많아서 한 달에 한 편은 ‘야 이제 이런 게 되네’ 이런 논문들이 항상 있어요. 계속 접하다 보니까 ‘야, 딥러닝은 너무 대단한 기술이다.’ ‘이게 어디까지 갈까?’ ' 진짜 안 되는 게 없겠다’는 겁니다.

딥러닝을 공부하면서 인간에 대해서도 되게 고민을 많이 하게 됐거든요. 인간은 이런걸 어떻게 하는거지, 인간은 어떻게 그림을 그리지, 인간은 어떻게 감정을 표현하지, 그게 논리가 아닌데, 느낌인데… 논문을 엄청나게 많이 봤더니, 서서히 딥러닝과 사랑에 빠지게 된 것 같아요."

[딥러닝을 사랑한다는 말을 쓰는 창업가, 그가 뽑은 '사랑하는 과학논문']

‘BEYOND THE IMITATION GAME: QUANTIFYING AND EXTRAPOLATING THE CAPABILITIES OF LANGUAGE MODELS’ : 딥러닝 모델의 능력을 측정하는 건 점점 더 어려워지고 있습니다. 이 논문은 수백개의 task를 통해 대형 딥러닝 언어 모델의 능력을 측정하고자 하는 시도를 담은 논문입니다. 측정이 점점 어려워지고 있는 현재 딥러닝 언어 모델의 현주소를 잘 보여주고 있죠.
‘PaLM: Scaling Language Modeling with Pathways’ : 최근 람다의 근간이 된 논문입니다. 농담을 설명하고, 속담을 이해할 수 있는 언어 모델의 능력이 매우 놀랍게 느껴집니다.
‘Underspecification Presents Challenges for Credibility in Modern Machine Learning’ : Underspecification이라는 개념을 새롭게 깨닫게 해준 논문입니다.
‘Language Models are Few-Shot Learners’ : 그 유명한 GPT-3 논문입니다. 엄청나게 많은 데이터를 엄청나게 큰 모델로 학습시키면 아무것도 안해도 다양한 능력을 갖추게 된다는 걸 증명해냈습니다.
‘Scaling Laws for Neural Language Models’ : 언어 모델의 능력은 데이터, 모델 크기, 컴퓨팅 파워 3가지로 결정되는데, 이 3가지를 계속 늘려나가면 계속 능력이 증대될 수 있다는 사실을 보여주는 논문입니다. 결국 몇 번의 breakthrough 이후에 딥러닝은 인간이 하는 모든 것을 하게 될 거라고 생각합니다."

-첫눈에 반한 건 아니고, 스며드는 사랑? 딥러닝과?

"딥러닝을 만난건 2017년, 사랑엔 2018~2020년 3년에 걸쳐서 빠진 것 같아요. 지금도 일주일에 한 편 정도는 있습니다. 저한테는 논문보는 게 여가시간 같은 거예요. 일주일에 한 번씩 리서처들과 '논문 수다’라고걸 합니다. 같은 논문을 봐도 저와 리서처가 보는 관점이 조금 달라요. 저는 ‘이게 왜 되지?’ 약간 이런 느낌이고, 리서처는 좀 구현 쪽 관점으로 봐요. 서로 핏이 좋더라고요. 되게 큰 즐거움이죠.
"요즘은 논문 읽는 게 눈치가 조금 보여요. 예를 들면 민희님(홍보담당)도 “대표인데 그렇게 맨날 논문 읽고 그러면 돼요?” 잔소리를 많이 하시고. 채용담당하는 분도 “이거는 시간을 제대로 쓰는 게 아닌 것 같습니다. 종윤님”이라네요. 일단 재밌으니까 계속 읽고 있고요. 기술을 전반적으로 이해하는 게 전략을 짤때 중요하지 않나요? 일주일에 3 편 읽는 건 오바지만 일주일에 한 편 정도는 읽어도 괜찮지 않나요? 회사에도 도움이 된다고 믿고 있습니다.

-이번주 논문수다는 뭐였어요?

"매주 화요일이 논문 수다 시간이거든요. 메타의 블렌더봇3. 딱 지난주 말쯤에 나왔을 거에요. 메타의 핵심 구조는 크게 한 3 가지 정도로 볼 수가 있는데, 아까 말씀드렸던 기억. 기억 관련된 구조. 블렌더봇3가 인터넷 검색을 할 수 있거든요. 인터넷 검색과 관련된 구조, 그다음에 세 번째는 그 사람과 대화를 하면서 사람과 대화한 기록을 가지고 재학습하는 거죠. 세 가지가 블렌더봇 3의 키 아이디어인데, 저희가 생각하는 방향과 매우 유사한 면이 있어요. 한편으로는 ‘아 이게 맞구나 우리가 가는 방향이 맞구나’라는 안심도 있었고요."

"(과학)논문은 전문가들이 읽는 거고 일반인은 읽을 수 없을 거라고 사람들이 겁을 좀 많이 먹는 것 같은데, 그렇지 않아요. 논문도 그냥 글이에요. 영어가 많기 때문에 영어적인 부분은 다른 얘기긴 하지만. 당연히 처음에는 어렵죠. 근데 무작정 계속 읽다 보면 어느 순간 알게 되거든요. 태어날 때부터 문과 또는 이과 딱지 붙이고 나오는 것도 아니고, 저는 문과, 이과의 그런 장벽도 별로 좋아하지 않거든요. '인터넷이 이렇게 발전한 사회에서 정말 호기심과 의지만 있으면 배울 수 없는 것이 없다’ 이게 기본적인 생각입니다."

트윗하기

웹에서 보기

공유 부끄럽지 않은 글 쓰겠습니다. 콘텐츠가 괜찮다싶으면, 지인에게도 널리 알려주세요. 페북과 트윗도요. 뉴스레터 스타트업은 주3회 보내는 유료멤버십입니다.

지난 기사 보기

개인은 월 6900원(가입은 이 링크를 클릭하세요)

법인은 월 9만8400원(40명 구독 가능. 가입은 이 링크를 클릭하세요)