미라클 모닝을 하는 일잘러들의 참고서
2022.10.17 | 521호 | 구독하기 | 지난호

인공지능 화가가 그림을 그려준다. 인공지능이 작곡을 해준다. 인공지능이 삼행시를 짓는다. 기사나 소셜미디어 통해서 이런 내용을 들어보셨을 것 같은데요. 이같이 뭔가를 만들어내는 인공지능을 통틀어서 ‘생성형 인공지능(Generative AI)’라고 부른다고 합니다. 미라클레터에서도 아래처럼 여러 번 다뤘던 주제.

 

인공지능 화가는 안드로이드를 그리는가? : Text to Image AI 미드저니 사용기

 

인공지능 '달리2'가 그린 페이메이르의 작품 : 달리2 의 Text to Image 기술


그런데 오늘 또 ‘생성형AI’를 주제로 들고 나왔는데요. 왜냐면 그동안은 앞선 기술을 소개하는 측면이었다면 이제는 당장 이 기술을 나의 직업을 위해 사용할 수 있을 정도로 코 앞에 다가온 기술이 되었기 때문입니다. 이건 반대로 ‘생성형AI’가 누군가의 일자리와 생계를 빼앗을 갈 수도 있다는 뜻입니다. 최근 나온 AI 트렌드 보고서에서도 이에 대해서 자세히 다루고 있어서, 오늘은 생성형AI 에 대해서 다뤄보고자 합니다! 

오늘의 에디션
  1. 일러스트 업계가 뒤집힌 이유
  2. 빅테크들 너도나도 AI 창작 서비스
  3. 혜성처럼 나타난 스테이블 디퓨전
  4. 미라클챌린지 우승자 발표!
미라클레터가 노블AI 로 생성한 기자 일러스트.
 프롬프트 : man, journalist, laptop, black hair, brown skin, glasses, short hair

일러스트 업계가 뒤집힌 이유

최근 2주간 일러스트 업계는 인공지능으로 인해 떠들썩했습니다. 여기서 일러스트 업계란 전반적인 그림이 아니라 일본 ‘아니메(Anime)’ 스타일의 일러스트를 그리는 업계를 뜻하는데요. 만화 표지, 웹소설 표지, 게임 등에서 일러스트로 주로 쓰이고 있어요. 이런 일러스트레이터들에게 돈을 주고 그림을 그려달라고 맡기는 것을 ‘커미션’이라고 부릅니다. 회사에 소속되어 있어서 이런 스타일의 그림을 그리는 일러스트레이터들도 있고, 커미션으로 생활비를 버는 프리랜서 일러스트레이터들도 꽤 있었죠. 정확한 규모는 알 수 없지만 시장이 존재하고, 기업 내에서도 명확한 수요가 있는 직군이었습니다.

 

하지만 10월 한 회사가 내놓은 서비스로 인해 일러스트레이터들은 존재의 불안감을 느끼게 되었습니다.

 

바로 노블AI(Novel AI)라는 회사가 내놓은 ‘NovelAI Image Generation’ 때문입니다. 이 회사는 이름 그대로 인공지능이 소설을 써주는 서비스를 개발하는 회사였습니다. 그런데 이 회사가 Stable Diffusion 이라는 오픈소스 Text-to-Image AI 모델을 사용해 아니메 일러스트에 최적화된 서비스를 내놓은 것 입니다. DALL-E 2, 미드저니, 스테이블디퓨전 같은 기존의 서비스들과 다르게 일본 아니메 그림을 학습시켜서 텍스트를 입력하면 일본 아니메 스타일 일러스트를 그려주는 서비스 였습니다. 

 

노블AI와 스테이블 디퓨전에 대한 설명 영상. <코딩애플>

5만원 주고 만들던 것 15원이 됐다

그런데 인공지능이 그린 아니메 스타일 일러스트가 웬만한 평범한 일러스트레이터의 수준을 뺨치는 결과물들이 나오기 시작했습니다.

 

이 노블AI 의 결과물 때문에 우리나라 뿐만 아니라 전 세계 소셜미디어와 온라인 커뮤니티가 떠들썩했습니다. 왜냐면 일러스트레이터들 입장에서는 수년간 공부를 통해서 어렵게 익혔던 기술이 AI가 순식간에 따라할 수 있는 것으로 나타났기 때문입니다. 한 장의 AI 일러스트가 만들어지는데 걸리는 시간은 약 1분. 노블AI 의 경우 월 10달러 구독서비스를 가입하면 일러스트를 그리는데 쓸 수 있는 화폐를 주는데 이것으로 환산한 그림 한 장당 가격은 15원에 불과했습니다. 보통 커미션의 가격은 그림의 타입과 필요한 노력에 따라 다르지만 장당 1만원~10만원 범위에 들었던 것을 감안하면 충격적인 비용이었습니다.


실제로 제가 사용해보니 그 자체로 완결되는 작업물이 나오는 경우는 드물었고 약간의 수정작업이 필요했습니다. 특히, AI 화가는 손가락을 잘 못 그리는 경우가 많았는데요. 한 명의 캐릭터만 나오는 일러스트의 경우 그럭저럭 쓸만 했지만 등장인물을 여러 명으로 늘리자 실망스러운 결과물이 많았습니다. 하지만 이런 단점들이 향후 개선될 여지가 있다는 걸 생각해보면 '돈 내고 써볼만한데?'라는 생각이 들었습니다. 

마이크로소프트의 디자이너 앱 <MS 365 유튜브>
빅테크들 너도 나도 AI 창작 서비스


지난 몇 주 간은 빅테크들이 너도나도 생성형AI를 이용한 서비스를 자랑하는데 바빴습니다. 대표적인 Text to Image 서비스인 스테이블 디퓨전과 미드저니가 인터넷에서 유행어(buzzword)가 되기 시작하자 빅 테크들은 다급하게 자신들이 연구하고 있던 생성형AI를 꺼내놓기 시작했습니다.

 

9월29일 : 메타가 ‘문장’만 입력하면 비디오를 만들어주는 ‘메이크-어-비디오(Make A Video)’를 공개했습니다.

 

10월5일 : 구글이 자신들이 개발 중인 Text to Image 서비스 Imagen AI를 동영상으로 확장시킨 Imagen Video를 공개했습니다.

 

여기까지는 빅테크들이 ‘나도 이런 거 할 수 있어! 나도 AI 잘해!’라는 수준이었다면 마이크로소프트의 최근 발표는 한 단계 나갔습니다.

 

10월12일 : 마이크로소프트(MS)는 이그나이트 컨퍼런스를 통해 DALL-E 2의 Text to Imagen 기능을, 새롭게 출시될 예정인 'MS 디자이너스 앱'과 '엣지 브라우저'에 장착시키겠다고 발표했습니다. 마이크로소프트는 DALL-E 를 만드는 오픈AI에 지난 2019년 1조원을 투자했는데요. 다들 기술을 자랑하는 동안 소비자들이 바로 사용할 수 있는 서비스를 내놓은 것입니다.


마이크로소프트의 디자이너스 앱이 위협적인 것은 캔바(Canva)라는 유니콘 기업이 만든 ‘일반인들을 위한 디자인 시장’에 MS가 직접 뛰어들기 때문인데요. 그 전면에 내놓은 기능이 바로 Text-to-Image 생성형AI 였습니다. 서비스가 나와 봐야 알겠지만 게임체인저가 될 수도 있을 것 같아요.  

 

DALL E 2 베타테스트로 만들어 본 일러스트. <오픈AI>
 프롬프트 : man, journalist, laptop, black hair, brown skin, glasses, short hair

혜성처럼 나타난 스테이블 디퓨전


생성형AI 는 사실 몇 년 전에도 있던 개념. AI를 이용해서 뭔가를 만들어내는 것이 모두 생성형AI 이기 때문이죠. 하지만 생성형AI 가 갑자기 유행어가 된 것은 이것을 이용해서 실제로 돈을 벌 수 있는 방법이 생기고, 평범한 개인들의 생활에도 영향을 미치기 때문인 것 같아요. 최근의 생성형AI 시장 트렌드에서 발견할 수 있는 몇 가지 시사점을 정리해볼 게요.  

 

  1. 생성형AI 시장은 무한 경쟁으로 이미 접어들었다.

 

텍스트 투 이미지를 처음 연 것은 누가 뭐래도 오픈AI의 DALL-E 2. 하지만 최근의 붐을 주도하는 것은 스테이블디퓨전을 만든 스테빌리티AI 라는 곳이에요. 인공지능학회 CVPR 2022년에서 발표된 ‘Latent Diffusion Model’을 바탕으로 AI커뮤니티와의 협업으로 기존보다 훨씬 빠르고 저비용으로 인공지능 화가를 만들었어요. 구글이나 메타같은 거대기업이 아니더라도 AI 연구자들의 협업으로 엄청난 성과를 낼 수 있다는 것을 보여줬어요. 놀라운 것은 이 모든 결과를 오픈소스로 공개해서 누구든 스테이블 디퓨전의 모델을 가져와서 사용할 수 있다는 점이에요(API 쓰는 건 유료에요). 노블AI도 스테이블 디퓨전의 것을 일부 수정했죠.

 

이렇게 되자 DALL-E 2 도 9월말 사용자를 제한적으로 받는 것을 중단하고 누구든지 사용할 수 있게 정책을 바꿨습니다. 문장을 입력 만해도 그림을 그려주는 기술이 신기했는데 이제는 기술 자체가 순식간에 대중화되어버렸습니다. 


일본의 경우 린나(Rinna)라는 일본기업의 주도로 일본어 캡션 데이터를 기반으로 파인튜닝을 하는 '일본어 스테이블 디퓨전' 프로젝트이 시작됐습니다. 아마 일본인 고객들이 가장 맘에 들어하는 결과물은 여기서 나오게 되지 않을까요? 


인공지능 그림이 효과적인 그림은 정해져있는 것 같아요. <오픈AI>
프롬프트 : an korean man and a white woman journalist argue in conference room, van gogh style
  1. AI를 가지고 돈을 버는 방법이 ‘더’ 중요 해진다

 

똑같은 AI 기술이지만 기존의 AI가 그린 그림과 노블AI 가 그린 그림이 사람들에게 주는 충격이 달랐던 것은 후자는 구체적으로 파괴하는 시장이 있었고, 거기에 추가로 새로운 시장을 만들어낼 가능성을 보여줬기 때문이에요. 즉, 기술보다는 그 기술을 가지고 어떤 시장을 공략하고 어떻게 돈을 벌 수 있는지가 중요해졌습니다. 

 

만화 풍 일러스트를 그리는데 15원 밖에 돈이 들지 않는다면 어떤 일이 벌어질까요?

 

1) 만화를 좋아하는 사람들은 자신의 프로필 사진으로 AI가 그린 ‘나만의 만화캐릭터’를 사용할 거에요.

2) 아마추어 웹소설 작가들도 커미션을 부탁하지 않아도 멋진 표지를 갖게 될 거에요. 

3) 만화는 못 그리지만 이야기를 만들 수 있는 사람은 이미지를 여러 장 생성해 직접 만화(웹툰)를 만들려고 할거에요. 만화뿐일까요? 이모티콘을 만들 수도 있죠! 캐릭터로 굿즈도 만들 수 있어요! (저작권 문제는 아직 해결 안되었지만) 

 

생성형AI가 의미 있는 것은 기존의 시장을 파괴하고 사람들이 일자리를 잃게 만드는 것이 아니라, 기존에는 이를 사용하지 못했던 사람들이 여기에 기꺼이 돈을 내도록 만드는데 있을 것 같아요. 저작권에 민감한 기업이나 유니크한 일러스트가 필요한 사람들은 기존의 유능한 일러스트레이터들에게 비용을 그대로 지불할 것 같아요. 반면 경쟁력이 낮은 일러스트레이터들은 시장에서 퇴출될 가능성이 높아 보입니다.  


워터마크 까지 같이 그려 버린 인공지능.  <Lexica>
 프롬프트 : Old donald trump behind the bars in a jailnews photo
  1. AI모델보다 데이터가 중요하다.

 

노블AI 는 당연히 일본 아니메 스타일의 일러스트를 학습할 필요가 있었어요. 인공지능 화가는 완전히 새로운 것을 창조하는 것이 아니라 인간들이 수없이 만들어놓은 기존 작품을 참고해서 그 스타일을 모방하게 되요. 그러므로 아니메 스타일의 결과물을 원하는 사람들을 위해서는 그런 스타일의 데이터를 학습시켜야하죠.

 

이 과정에서 노블AI가 ‘불펌’사이트의 데이터를 사용했다는 것이 알려져서 논란이 되기도 했습니다.

 

AI 일러스트가 넘쳐나면서 제일 위험해보일 수 있는 회사. 바로 게티이미지인데요. 게티이미즈는 AI가 생성한 이미지를 자신들의 사이트에 올리는 것을 금지했어요. 이것은 해당 이미지가 저작권문제가 생길 수 있다고 봤기 때문이에요. AI 화가가 학습한 수많은 이미지가 있을텐데요. 그중에 저작권 문제가 있는 그림이 있었을 수도 있죠.

 

이것은 어떻게 알 수 있냐구요? 인공지능에게 어떤 이미지를 생성하도록 했을 때, 게티 이미지의 워터마크(불법 복제를 막기위한 글씨)가 함께 생성된 경우가 많았거든요. 즉, 저작권이 있는 게티이미지를 불법으로 사용했다는 의심을 주고 있습니다. 

 

이런 점에서 생성형AI에 사용할 수 있는 우수하고 저작권 문제가 없는 데이터를 만들어내는 일이 중요해질 것 같아요. 최근 AI 업계는 ‘합성데이터(Synthetic Data)’라고 하는 AI가 만든 데이터가 많이 사용되고 있는데요. 데이터를 취득하는 비용이 높기 때문에 실제 데이터가 아닌 인위적인 데이터를 만들어서 학습에 사용하는 것이랍니다. AI 모델보다는 AI 학습에 사용되는 데이터의 중요성을 보여주는 것이죠! 



미라클 챌린지 우승자 발표! 

 

미라클레터 500호 기념으로 지난 9월 한달간 미라클레터 구독자님들을 대상으로 진행한 구독자 유치 이벤트 미라클 챌린지! 드디어 우승자를 발표합니다. 원래는 가장 많은 추천을 해주신 분께 20만원 상품권을 드리는 것으로 되어있었는데 1,2 등의 차이가 너무 근소해서 2등상을 만들어 드리게 되었습니다. 휴대전화번호 뒷자리 4자리로 확인을 부탁드리겠습니다. 


1등 : 신세계백화점 상품권 20만원 기프티콘

***-6305 님 28명 


2등 : 신세계백화점 상품권 10만원 기프티콘

***-1323 님 25명


참여상 : 신세계백화점 상품권 3만원 기프티콘

***-9821 님
***-0436 님
***-5413 님 
***-5059 님
***-0200 님
***-0807 님
***-9876 님 
***-6165 님


참여해주셔서 너무 감사합니다! 개별적으로 다시 연락드리겠습니다! 


한줄 브리핑 📢
  • 데이터센터 화재로 카카오 멈췄다  : 아마 많은 미라클러님들이 경험하셨죠? 카카오톡 뿐만아니라 카카오페이, 카카오택시 등 여러 서비스들이 연쇄적으로 영향을 받았습니다. 데이터센터의 중요성을 다룬 레터를 한번 읽어보고 싶으시다면 여기로!
  • 메타 신형 VR 헤드셋 공개 : 메타(구 페이스북)가 메타 커넥트 컨퍼런스를 열고 신형 VR 헤드셋인 메타 퀘스트 프로를 공개. 자그마치 가격이 1500달러. 그런데 외신에서는 메타의 메타버스 소셜플랫폼인 호라이즌월드에 하반신이 등장한 것이 더 화제. 
  • 메타버스 플랫폼 사용자가 고작 : 메타 저격수인 WSJ 가 호라이즌월드의 월 사용자가 28만명 정도밖에 되지 않는다고 보도. 한편 크립토 업계의 대표적인 메타버스인 디센트럴랜드는 일사용자가 8000명이라고 공개. 일 30명이라는 보도에 대한 정정이었지만 역시 많지 않은 숫자. 
  • 구글의 3D 영상통화 부스  : 구글이 3D 영상통화 부스 서비스를 내놨어요. 이 부스에 들어가서 영상통화를 하면 상대방을 3D 이미지로 리얼하게 볼 수 있다고. 사라져가는 공중전화가 다시 부활하려나요?  
  • 넷플릭스 광고 요금제 월5500원 : 넷플릭스가 월 7달러(한국에선 5500원)의 광고요금제를 내놨어요. 1시간마다 4-5분씩 광고를 봐야하고 HD 화질로 1대만 접속 가능. 
맺음말

Text to Image 는 앞으로 등장하게 될 생성형AI의 한 가지 예시에 불과. 지금은 일러스트에서 시작했지만 앞으로는 우리가 인간의 창의적인 영역이라고 생각했던 거들이 더 많이 AI에 의해 대체될 것 같아요. 가트너에 따르면 2025년까지 생성형AI가 만들어내는 데이터가 전세계 데이터 생성의 10%를 차지할 것 이라고 예상했어요(현재는 1% 미만). 그렇다면 창조성의 영역에서 앞으로 인간의 역할은 무엇일까요? 어느 영역이든 AI가 쉽게 대체할 수 없는 영역이 있고 그 부분에서 인간의 역할은 더 커질 수도 있을 것 같아요.

 

그런 점에서 이런 상상을 해봤습니다.

 

1) 쉽게 창작 가능한 온라인에 대비되는 오프라인 창작의 가치가 올라갈 것 같고요.

2) 디지털 창작물에 가치를 부여하는 IP 라던지 NFT 같은 것들의 가치가 올라가게 될 것 같아요.

3) 아이디어, 상상력, 스토리텔링, 사회적 지능과 같은 높은 차원의 인간의 언어능력이 중요해질 것 같아요.

 

내가 하는 일이 AI 와 기술에 의해 대체될 수도 있다는 두려움. 누구나 한번 쯤 가져볼 것 같은데요. 걱정하지 마시고 지금처럼 상상하고, 고민하고, 사람들을 만나고, 실행에 옮기세요! 미라클레터가 도와드리겠습니다. 🙂



당신의 멋진 미래를 응원합니다
이덕주 드림

 

오늘 레터를 평가해주세요!  
Miracle morning
with
MIRAKLE LETTER!
서울 중구 퇴계로 190 매경미디어센터
매경미디어그룹
miraklelab@mk.co.kr
02-2000-2167