미라클 모닝을 하는 일잘러들의 참고서 미라클러님! 저는 오늘 구글의 연례 개발자 행사인 I/O에 와 있습니다. I/O는 2008년 시작된 개발자가 중심이 되는 행사로, 구글 생태계에 참여하는 사람들을 위한 주요 발표가 나오는 행사에요. 개인적으로는 애플의 WWDC, 마이크로소프트 BUILD와 함께 글로벌 3대 개발자 행사라고 꼽고 싶어요. 오늘은 구글 I/O에서 있었던 발표를 다뤄보려고합니다.
TMI : I/O는 구글이라는 회사명의 기원이 된 구골(googol : 10의 100승)의 제일 앞 두 숫자 1과 0에서 가져왔다고 합니다.
|
|
|
- I/O 하루 전 한방 먹은 구글
- 김빠진 아스트라에 스마트글라스를 넣었더니
- 한줄브리핑
|
|
|
웃고 있지만 웃는게 아니야. <사진=구글>
I/O 하루 전 오픈AI 에게 한 방 먹은 구글
구글 I/O가 개막하기 하루 전날인 13일 오전 10시. 오픈AI가 최신 모델인 GPT-4o를 유튜브 라이브로 공개했어요. 누가 봐도 I/O를 앞두고 ‘찬물 끼얹기’가 목적인 것으로 보였죠. 특히, 오픈AI는 GPT-4o의 여러 기능 중 ‘음성 모드’를 집중적으로 다뤘어요. GPT-4o가 사람을 위해서 노래를 불러주거나, 사람의 감정을 이해하는 등 영화 그녀(Her)에서 스칼렛 요한슨이 목소리를 맡은 AI 사만다 같은 높은 수준의 AI였어요. 그런데 아니나 다를까 다음날 I/O에서도 비슷한 기능인 ‘제미나이 라이브’와 ‘프로젝트 아스트라’가 공개됐습니다. 오픈AI도 진작에 '음성AI'를 준비를 하고 있었는데 구글에서 비슷한 것을 발표할 것을 당연히 알고 이를 미리 터뜨린 것으로 보입니다. 마치 애니메이션 톰과 제리에서 톰을 계속 곤경에 빠트리는 제리처럼 오픈AI는 이번에도 구글에 한 방을 날렸습니다. 😩 |
|
|
구글 잡으러 다이내믹 듀오가 왔다. <마이크로소프트>
오픈AI+마소 vs 구글
지금의 생성형AI 개발 경쟁은 ‘오픈AI+마이크로소프트’연합군과 ‘구글’의 싸움이라고 봐도 될 정도인데요. 전쟁은 2022년 11월 오픈AI가 챗GPT를 내놓으면서 시작됐어요. 오픈AI의 AI기술이 앞서있다는 사실이 공개된지 얼마 안 돼 마이크로소프트가 빙에 GPT를 적용해서 구글의 최대 비즈니스인 검색서비스에 도전합니다(2023년 2월).
구글이 정신 못 차리는 상황에서 오픈AI는 멀티모달 능력을 갖춘 GPT-4를 공개하면서 한 방 더! 마이크로소프트가 이번에는 오피스 도구에 생성형AI인 코파일럿을 포함시키겠다고 다시 한번 공격! 구글은 다급하게 챗봇 바드를 공개하면서 “우리도 할 수 있어!” 라고 외쳤습니다. 이것이 모두 3월에 벌어진 일.
지난해 5월 I/O는 오픈AI와 MS의 협공에 그로기 상태였던 구글이 전열을 가다듬고 반격을 준비하던 시기였죠. 이때쯤 구글은 미국(구글 브레인)과 영국(딥마인드)으로 나눠져있던 AI연구개발 조직을 합쳐서 하나의 통합된 ‘AI’를 만들겠다고 결심한 것 같아요. 😤
|
|
|
우리가 최초의 참 트루 멀티모달 네이티브 AI 제미나이라네 <구글>
제미나이로 하나된 우리
11월 개발자행사에서 'GPT-4 터보'를 공개한 오픈AI가 ‘샘 올트먼 축출 사태’로 혼돈에 빠져있는 상황에서, 구글은 12월 마침내 ‘제미나이(Gemini)’를 공개해요. 모든 조직의 역량을 하나로 모으고, 산발적인 브랜드도 하나로 모으고, 멀티모달을 네이티브로 만들어진 최초의 AI. 그것이 제미나이였어요.
이때쯤 구글은 오픈AI와 비교해 자신의 강점이 무엇인지를 확실히 깨달은 것 같아요. 오픈AI처럼 작은 기업이 가진 유연성과 속도는 따라갈 수 없지만 ‘대기업’이 가질 수 있는 막강한 강점이 있죠! 안정적인 현금흐름에서 나오는 자본과 다양한 고객 및 제품이 구글의 강력한 무기.
구글은 차세대 TPU를 계속 개발하면서 인프라 비용을 전체적으로 낮췄고, 이를 통해 AI학습 비용은 물론 고객들에게 제공하는 제미나이 API비용도 낮출 수 있었어요. 이번 I/O에서 구글은 제미나이 1.5프로의 비용을 절반으로 낮춰서 GPT-4o보다 30% 저렴하다고 해요. 역시 I/O에서 공개된 제미나이 1.5 플래시는 오픈AI의 가장 저가 모델보다 훨씬 저렴해요.
구글은 오픈AI의 월 20달러 구독 서비스인 챗GPT 플러스의 경쟁 서비스인 제미나이 어드밴스드를 판매하고 있는데요. 제미나이 서비스에 추가로 저장공간을 2테라바이트나 제공해요. 제미나이와 챗GPT의 성능이 똑같다면 저장공간도 제공해주는 ‘제미나이’가 더 매력적! |
|
|
AGI 만들기 위해 둘이 함께 걸어갑시다. <AP통신>
제미나이? 넌 이미 늙은나이
그래서 I/O 하루 전 공개된 GPT-4o는 구글 제미나이에 대한 오픈AI의 ‘응답’이라는 생각이 들었어요. ‘제로’에서부터 GPT-4o를 학습시키면서, 비용을 낮추고 속도를 높였거든요. 또한, 2월에 텍스트를 비디오로 만들어주는 '소라(Sora)'를 공개한데 이어 5월에는 영화 매력적인 보이스AI를 공개하면서, 자신들이 AI 개발 기술 경쟁을 주도하고 있다는 인식을 대중과 개발자들에게 확실히 남겼어요.
하지만 구글도 가만 있지 않습니다. 구글은 I/O에서 오픈AI와 경쟁 관계의 서비스를 여럿 내놨어요. 소라의 대항마인 ‘비오’. GPT를 커스텀하는 GPTs 와 비슷하게 제미나이를 커스텀하는 ‘Gems’ 등을 공개했습니다. AI 개발자 생태계를 구축해야하는 두 회사 입장에서는 이런 주도권 싸움이 정말 중요해요. |
|
|
스마트글라스를 쓰고 AI와 대화하는 모습 <구글>
김빠진 아스트라에 스마트글라스를 넣었더니?
오픈AI가 하루 먼저 AI를 공개하면서 구글의 AI어시스턴트는 ‘김빠진 아스트라’가 되버렸지만 한 가지는 사람들의 뜨거운 관심을 모았습니다. '프로젝트 아스트라'데모에서 스마트폰으로 AI와 대화를 하고 스마트폰 카메라로 AI에게 영상을 보여줬는데요. 데모에서 사용자가 안경을 쓰면서 분위기가 급변합니다. 이 안경이 그냥 안경이 아닌 ‘스마트글라스’였거든요. 안경에 달려있는 카메라로 AI가 주변을 보고, 안경에 달려있는 스피커를 통해서 AI와 대화를 하는 것! 😎
많은 사람들이 구글이 ‘글라스’를 다시 만드나? 라고 생각할 수 밖에 없어요. 메타 레이밴 스마트글라스에서 알 수 있듯이 스마트글라스는 AI를 탑재시키기 매우 좋은 기기랍니다.
구글은 2023년 삼성전자, 퀄컴과 동맹을 맺고 XR기기를 만들기로 했어요. 구글은 OS를, 퀄컴은 반도체를, 삼성전자는 제조를 맡는 구조. 이 기기는 비전 프로 같은 MR헤드셋일 수도 있고, AR글라스일수도 있어요. 다만 무엇이 나올지는 아직 알려져 있지 않아요. |
|
|
'3대 AI 기기' 월저널 기자가 써보니... (재미있으니 꼭보세요) <WSJ>
세르게이 형이 여기서 왜 나와??
사실 스마트글라스는 구글에게 큰 아픔이 있는 기기랍니다. 2013년 창업자 세르게이 브린이 AR기기인 '구글 글라스'를 세상에 공개했는데요. 미래 지향적인 컨셉임에도 불구하고 1500달러의 높은 가격과 사용처가 없다는 한계점때문에 큰 실패를 하게되거든요.
그런데 이 실패의 주역 세르게이 브린이 올해 구글 I/O에 나타납니다. 그러자 기자들이 물어봐요.
😺 : "아스트라 영상에 스마트글라스가 나오던데 구글글라스 다시 나오는건가요?"
🧔 : "AI어시스턴트가 스마트글라스의 킬러앱일 겁니다. 제가 너무 빨리 10년 일찍 스마트글라스를 내놓은 것 같아요."
😾 :"그래서 나오는 건가요?"
🧔 : ... (무응답)
AI에이전트 데모영상에 스마트글라스가 나오고, 그 스마트글라스를 만들었다가 실패한 창업자가 등장하고... 뭔가 저에게는 의미심장하게 느껴집니다. |
|
|
나에 대해서 속속들이 아는 그녀..
애플과 가까워지는 오픈AI?
사만다를 만들기 위한 과정에서 오픈AI에게는 최대의 약점이 있어요. 바로 테오의 데이터에 접근이 불가능하다는 것! 영화 '그녀'에서 인간 테오가 AI 사만다와 사랑에 빠질 수 있었던 것은 '사만다'가 그 누구보다 '테오'를 잘 아는 존재였기 때문이에요. 하지만 스마트폰이나 PC등 하드웨어 기반이 없는 오픈AI는 개인의 정보를 확보하기가 쉽지가 않답니다. 반면 구글은 우리의 이메일부터 캘린더, 비밀번호, 유튜브, 검색까지.. 모든 정보를 갖고있죠!
그래서 오픈AI가 애플과 가까워지고 있다는 최근의 기사들은 또 의미심장해보여요. 오픈AI의 챗GPT가 아이폰에 탑재된다는데 어느정도로 두 회사가 가까워지는 걸까요? 이번 GPT-4o 가 공개되면서 맥OS용 챗GPT 앱이 처음 공개되었는데 이건 어떤 의미일까요?
애플이 오픈AI를 인수하면 어떨까요? 샘 올트먼이 가장 존경하는 사람이 스티브 잡스였고, 그가 첫 창업한 회사는 아이폰용 앱을 만들었다는 것 미라클레터에서 말씀드렸던 것 같은데요! 마침 애플이 직접 AI반도체도 만든다는데..?? 샘. 너 AI반도체가 필요하다고 하지 않았어? . |
|
|
브로맨스를 넘어 로맨스로 가자!
사실 오픈AI는 구글의 다크나이트?
지금의 생성형AI 개발 경쟁은 ‘오픈AI+마이크로소프트’연합군과 ‘구글’의 싸움이라고 말씀드렸었죠? 오픈AI와 구글의 발표를 보면서 두 회사가 치고박고 싸우는 가운데 두 회사의 기술력은 지금 로켓처럼 날아가고 있어요. 오픈AI에게 한 방 먹었다고 구글을 비웃을 수도 있지만, 지금 구글처럼 AI를 여러 서비스에 통합시킨 회사는 별로 없을거에요. 만약 오픈AI가 없었다면 구글이 이렇게 빠른 속도로 개발에 성공할 수 있었을까요?
구글의 전설. 제프 딘은 자신의 X 계정에 아래와 같은 글을 남깁니다.
"우리 제미나이 모델이 어제 오픈AI 이벤트를 즐겁게 시청했어요. 무라티 CTO, 마크 첸, 바렛! 훌륭한 작업입니다! (그리고 뒤에서 일하셨던 분들도요).
|
|
|
결국 '웃으며 춤추는 사람'이 승자 아닐까요? <제프 딘 트위터>
아스트라 너 쫌 대단하다?
구글은 I/O에서 '프로젝트 아스트라'를 직접 체험해 볼 수 있는 부스를 운영했어요. 저도 들어가서 시연해봤습니다. 터치스크린에 빨간색 펜으로 '하트'를 그리고 이것이 무엇인지 음성으로 물어보자 쉽게 정답을 말했습니다. 여기에 하트에 금이 가는 표시를 하고 물어보니 Broken Heart 의 의미에 대해서도 잘 답했습니다. 또 Broken Heart 가 어떤 감정을 의미하는 지에 대해서도 제미나이는 잘 알고 있었습니다. 반응도 매우 빨랐고 음성 인식률도 좋았어요. 다만 아직 영어 성능만 뛰어나고 한국어는 잘 안된다는 설명을 들었습니다. 오픈AI의 'GPT-4o' 보이스 모드 처럼 진짜 인간 여성과 대화하는 느낌은 덜 했지만 말을 끊는 것도 가능했고 친근한 대화도 가능했습니다. 오픈AI가 하루전에 'GPT-4o'를 발표하지만 않았어도 많은 화제를 모을 수 있었을 것 같았습니다. 😥
제한적인 환경에서 이뤄진 데모지만 기술적으로는 사만다를 구현하는 것이 그렇게 어렵지 않겠구나라는 생각이 들었어요. 하지만 이런 기술을 넘어 AI에게 어떤 업무를 시키거나, 어제의 대화를 기억시켜서 일관성 있는 대화를 하는 것은 조금 시간이 필요할 것 같아요. |
|
|
쏟아져 나오는 음성AI 들을 보면서 저는 두가지 생각이 들었어요.
첫번째, 영어능력이 앞으로 정말 중요해지겠다. 앞으로는 AI에게 명령을 내릴때 말로 해야하는데, 영어로 명령을 내릴 때 AI가 가장 유능한 성과를 낼 수밖에 없어요. 영어로 된 데이터를 가장 많이 학습했을테니까요.
둘째, 저처럼 말수가 적고 말을 논리적으로 못하는 사람은 AI 경쟁력이 떨어지겠다. AI에게 좋은 프롬프트를 입력시키려면 내가 원하는 것을 매우 구체적으로 빠짐없이 입력시켜야하는데요. 이는 말을 할때도 마찬가지에요. 앞으로는 코딩이 아니라 말을 조리있게 하는 법을 배워야하는 것 아닐까하는 생각이 들었습니다. 🤣
기술 발달의 속도가 너무 빨라서 어지러우신가요? 저도 그렇습니다. 하지만 AI처럼 기술의 발전 속도가 너무 빠른 경우, 후발주자가 오히려 유리한 점도 있답니다. 바로 기존에 배웠던 것(learn)을 버리는 언런(unlearn)의 과정이 필요없기 때문이죠. 그런점에서 출발이 늦다는 것에 대해서는 두려워할 필요가 없는 것 같아요. 다만 빠르게 달리는 기차에 한번 올라타셨다면 절대 내리지 말고 기차에 계속 앉아계셔야합니다! 미라클레터를 꾸준히 오픈해서 읽어주세요! 저는 다음 주에 다시 찾아오겠습니다.
|
|
|
Miracle morning
with
MIRAKLE LETTER! |
|
|
서울 중구 퇴계로 190 매경미디어센터
매경미디어그룹
miraklelab@mk.co.kr 02-2000-2167
|
|
|
|
|