#네이버 #카카오 #LG #자비스 2021.11.2 #162 안녕하세요, 님! 팩플레터 박수련입니다. 최근 네이버 카카오 같은 소프트웨어 강자뿐 아니라 LG, SKT, KT 같은 정보통신기술(ICT) 기업 전반이 초대규모 AI (Hyper Scale AI) 개발에 뛰어 들었습니다. 지난해 미국의 오픈AI 재단이 공개한 AI GPT-3의 충격 때문이었을까요. 올해 한국 IT 거물들은 어느때보다 활발하게, 민첩하게 움직였습니다. 특히, 한국 IT기업들이 한국어를 한국인처럼 잘하는 AI 개발에 도전하는 중이라 더 반갑습니다. 영어로 인간의 말을 공부한 AI보다는, 애초에 한국어로 훈련받은 AI가 한국인 사용자의 말을 찰떡같이 더 잘 알아들을 테니까요. 이런 관점에서 전세계 각국에서도 비(非)영어 기반 AI 개발 경쟁이 뜨겁다고 합니다. 이번 레터는 박민제·유부혁 기자가 취재해서 정리했습니다. 저도 몇몇 AI 연구자를 만나 얘길 들어봤는데요. 올해 AI의 한국어 능력을 평가할 수 있는 ‘공인테스트’(데이터셋)가 나와 꽤 고무적인 분위기였습니다. AI의 자연어 능력을 테스트 할 영어로 된 시험 GLUE(General Language Understanding Evaluation)가 2018년 나온지 3년만에 한국어도 그런 평가 체계를 갖춘 겁니다. AI를 얼마나 잘 활용하느냐에 따라 개인·조직·사회의 생산성이 달라질 거라고 하니, 한국말 잘하는 AI를 제 뇌의 보조기억장치로 쓸 수 있는 날이 언제쯤 올지 기다려집니다. 우리 한국어 AI들, 얼마나 열공하고 있는지 오늘 레터에서 살펴보세요! 언제나 감사합니다. Today's Topic AI도 통역이 되나요? 🧾 목차
누구냐 넌? 초대규모 AI 챗봇부터 스피커까지 주변에 대화할 인공지능(AI) 급증. 노래도 틀어주고 길도 알려주고 예약도 받아 준다. 나름 그 동네에서 똑똑하기로 이름 날리던 친구들인데, 문제는 말이 통하진 않는다는 점. 정해진 시나리오를 조금만 벗어나도 “잘 모르겠어요”를 연발한다. 인공지능이라 쓰고 인공 ‘바보’라 읽어도 딱히 반박할 수 없는 수준. 그런데 지난해 오픈AI가 초대규모 AI로 불리는 GPT-3를 선보이며 판이 바뀌었다. ① 뭐가 달라? 초대규모AI, 영화 ‘아이언맨’의 자비스나 ‘Her’의 AI비서와 닮았다. 물론 지금은 그 정도로 유능하진 않지만 말이 통하는가 면에선, 이전 AI들과는 아예 수준이 다르다는 평가.
Q. 이성계의 업적은? A. 조선을 건국했어. Q. 그거말고 다른 업적은? A. 불교 대신 유교를 채택했어.
② 어떻게 만들었어?
말잘하는 AI, 어디다 써? ‘미래는 이미 당신 곁에.’ 초대규모 AI는 일상 속 여러 서비스에 적용되며 영역을 확장하는 중. ① 잘 찾고 : 네이버는 지난 10월말 간담회에서 ‘에어서치’를 공개했다. 정답찾기 중심의 검색에 AI를 붙여 개인화된 결과를 보여주겠다는 게 골자. 가령, 에어서치에선 로그인한 사용자가 ‘캠핑’을 검색하면 그의 성별·연령에 따라 캠핑 준비물 리스트, 초보캠핑, 캠핑장비 등 정보가 나온다. 네이버는 에어서치 검색 결과 아래에 하이퍼클로바가 만들어낸 질문을 첨부했다. ‘맹장염 진단’을 검색하면 “맹장염은 어떻게 치료하나요?”라는 질문과 답변을 함께 링크해 보여주는 식. 구글도 사람처럼 대화할 수 있는 ‘AI 람다’를 검색에 도입할 계획이다. ② 잘 만들고 : 조건을 제시해주면 소설·시도 제법 쓴다. 다음은 카카오브레인이 개발 중인 초대규모 AI에게 박경리 작가의 소설 <토지>에서 딴 6~7줄 문장을 주자 뒤이어 쓴 내용. “그렇게 몇번을 되풀이 하자 그제야 사람들은 두 사내를 불러들인다.…(중략)…최서방은 오른 손을 번쩍 치켜들며 말한다. ‘어이 거 주댕이 좀 내밀어 봐. 자네들 혹시 무슨 일 있었나?’…(후략)…” 네이버의 하이퍼클로바는 ‘웹툰 여신강림, 유미의 세포들과 비슷한 느낌의 스토리를 짜달라’, ‘아이유 느낌으로 가사 써줘’ 등의 요구에 그럴싸한 결과를 내놓는다. 요약도 잘한다. GPT-3는 2만6449 단어로 된 이상한 나라의 엘리스를 136단어로 줄였다. 엘리스가 토끼굴에 떨어진 부분과 여왕을 만나서 겪은 모험담을 압축적으로 설명했다. ③ 후학도 양성 : AI 훈련에 필요한 데이터셋을 AI를 이용해 만들 수도 있다. 피자집 점원과 고객의 대화라는 상황을 주고, 비슷한 대화 10개를 만들라고 하면 자연스러운 대화를 생성한다. 이걸 다른 AI에게 입력해 학습시키는 것도 가능. 실제 데이터셋 없이도 AI를 훈련시킬 수 있다는 의미. ④ ‘코알못’도 ‘입코딩’ : 초대규모AI가 몰고올 가장 파괴적인 변화는 아마도 이것? 코딩 한줄 못하는 사람도 AI에게 필요한 프로그램을 말로 설명하면 AI가 코딩해주는, 이른바 ‘입코딩’이다. 오픈AI가 지난 8월 공개한 GPT-3 Codex가 그 예. 파이썬, 자바스크립트 등 12개 이상 프로그래밍 언어를 쓸 줄 아는 AI다. 이걸로 우주게임을 만들고 싶다면 우주선 이미지를 넣고 “이게 우주선이다”, “우주선을 평행으로 움직이게 하고 운석을 피하면 점수를 준다” 등의 지시를 내리면 된다고. ‘입코딩’이 발전하면, AI비서 자비스의 실사판이 가능할 지도. 프로 한국인 AI 왜 필요해? GPT-3, 한국말도 못하진 않는다. 그런데 지난 5월 네이버가 국내 최초로 한국어 초대규모 AI 하이퍼클로바를 공개한 것을 시작으로 카카오·LG·KT·SKT 등 국내 기업들도 앞다퉈 이 시장에 참여한다고 선언했다. 대체 왜? 차라리, GPT-3에 통역기를 붙이는 게 빠르지 않을까. ① 바벨의 도서관엔 한국어 책, 0.6%
② 영어와는 달라요
③ AI 생산성, 그림의 떡 될라
한국어AI, 누가누가 경쟁해? 초대규모 AI, 아무나 못 만든다. 클라우드 회사에서 장비를 빌려도 언어모델 한 번 돌리는데 기본 수십억 원이 든다고. 그럼에도 국내에선 네이버를 시작으로 카카오, LG, KT, SKT 등이 경쟁에 뛰어들었다. 네이버 강인호 책임리더는 “구글, 아마존 등과 경쟁해 이 서비스의 글로벌 주도권을 잡아야 한다”며 “지금 하지 않으면, 그들의 속도를 도저히 따라잡을 수 없을 것”이라고 말했다. ① 글로벌 선봉장, 네이버
② 추격자, K·L·K·S
AI 성장 부스터 샷, 클루 한국판 초대규모 AI들 간에도 우열은 있을 터. 어떤 언어모델이 한국말을 더 잘하는지 객관적으로 검증할 수 있을까. 이럴 때 필요한 게 시험이다. 공부 잘한다고 소문난 수재라도 대학 갈 실력이 되는지 보려면 대수능 점수나 SAT·토플 시험을 봐야하듯. 저마다 다른 책(데이터)으로 한국어를 배운 AI를 평가하려면 별도의 데이터묶음(data set)이 필요하다. 영어AI에선 GLUE가, 중국어 AI에선 CLUE라는 데이터셋이 그런 역할을 한다. 한국어 AI를 위한 KLUE도 있을까? 올해 5월에 KLUE가 세상에 나왔다.
네이버는 하이퍼클로바로 수많은 상품 리뷰를 한줄의 문장으로 추출해 주는 'AI 리뷰 요약'을 서비스 중이다. 자비스는 언제쯤 빅테크 간 불꽃 튀는 경쟁으로 초대규모 AI 성능은 J커브를 그리며 발전. 반도체의 집적도 향상이 랩톱, 스마트폰 개발로 이어졌듯 초대규모 AI 발전도 새로운 서비스 출현을 예고한다. 앞으로 초대규모 AI는 한 언어를 넘어 여러 언어로(멀티 링구얼), 텍스트에서 소리·이미지·영상(멀티 모달)으로 영역을 넓혀갈 전망. 속도와 방향성을 결정할 외부 요인은? ① AI가 썼다고? 이거 누구 거?
② 낯선 AI, 친구인가?
님 한국어 초대규모 AI, 5년 뒤라면 팩플 레터를 쓸 수 있을까요? (소요시간 1분) 다른 구독자분들의 의견과 취재 뒷이야기를 다음 ‘언박싱’ 레터에서 공개해요. 이번주에도 꼭 설문에 참여해주세요. 😌 팩플팀이 추천하는 자료 ※자료는 PC로 보시면 편해요! 팩플이 추천하는 기사도 보세요! ![]() 국내 블록체인 프로젝트로 시가 총액 세계 10위권을 달리는 테라(TERRA)를 아시나요? 권도형 테라폼랩스 대표가 미국 증권거래위원회와 소송 중인 사실이 최근 알려졌는데요. 테라 생태계에 여파는 없을지 팩플이 분석해 봤습니다. [팩플] “이제는 메타” 회사 간판 바꾼 페이스북, 저커버그는 왜? 페이스북이 회사 이름을 메타로 바꿨습니다. 지난달 28일 창업자인 마크 저커버그 최고경영자가 직접 나서서 이에 대해 설명했습니다. 페이스북이 모바일 다음(Next mobile) 혁신을 선점하기 위해 어떤 전략을 가지고 있는지 팩플이 짚어봤습니다.
👇링크 마우스로 복사하려면! |