오픈AI는 15초 분량 음성을 활용해 딥페이크(Deep fake) 목소리를 만들어내다
  No.12 / Apr 2024 
오픈AI, 모방 음성 생성 '보이스 엔진' 공개 

오픈AI가 또 큰일을 냈어요. 챗GPT의 프롬프트(입력창)에 명령어를 입력하면 동영상을 제작해 주는 인공지능(AI) '소라(Sora)'에 이어 이번에는 사람의 음성을 학습해 모방 음성을 생성하는 AI 도구 '보이스 엔진'(Voice Engine)을 내놨습니다. 오픈AI는 보이스 엔진을 공개하면서 모두에게 안전하고 유익한 AI를 개발하기 위해 최선을 다하고 있다고 밝혔습니다. 그러면서 보이스 엔진은 텍스트 입력과 15초의 오디오 샘플을 사용하면, 원래 화자와 매우 유사한 자연스러운 음성을 생성할 수 있다고 소개했어요. 

오픈AI

오픈AI(OpenAI)는 프렌들리 AI를 제고하고 개발함으로써 전적으로 인류에게 이익을 주는 것을 목표로 하는 미국의 인공지능 연구소에요. 이윤을 목적으로 하는 기업 OpenAI LP와 그 모체 조직인 비영리 단체 OpenAI Inc로 구성되어 있어요. 특허와 연구를 대중에 공개함으로써 다른 기관들 및 연구원들과 자유로이 협업하는 것을 목적으로 일론 머스크샘 올트먼 등이 설립을 주도하였으며, 미래에 발생할지도 모르는 인공 일반 지능의 존재 위험에 대한 염려가 설립의 주요한 동기 중 하나입니다.

인간 기자의 질문에 짜증난다는 듯이 해당 기자를 째려본 휴머노이드 AI로봇 아메카(Ameca). ⓒ AFP연합뉴스
📢 15초만 들으면 AI가 내 목소리 똑같이 흉내
  • 오픈AI는 지난 2022년 말에 보이스 엔진을 처음 개발했다고 해요. 오픈AI는 보이스 엔진을 사용해 텍스트 음성 변환 API(응용프로그램 인터페이스)에서 제공되는 음성과 챗GPT의 음성, 챗GPT의 읽기 기능을 강화했다고 해요. 

  • 오픈AI는 "우리는 보이스 엔진의 책임감 있는 배포, 우리 사회가 우리의 새로운 기능에 어떻게 적응할 수 있는지에 대한 대화를 시작하고자 한다"고 밝혔어요. 오픈AI의 보이스 엔진을 통해 사회 문제가 발생할 수 있다는 것을 우려한 것이에요. 때문에 보이스 엔진 기술을 대규모로 배포할지 여부와 방법에 대해 보다 신중한 결정을 내릴 것이라고 강조했어요.

           오픈AI 로고. ⓒ AFP 연합뉴스
📀 어린이 교육 음성 해설 콘텐츠 등 지원
  •  보이스엔진 기술의 잠재적 활용 가능성을 위해 오픈AI는 지난해 말부터 신뢰할 수 있는 소수의 파트너 그룹과 함께 비공개 테스트를 시작했어요. 오픈AI는 보이스 엔진의 소규모 비공개 테스트를 통해 보이스 엔진이 다양한 산업 분야에서 긍정적이고 선한 목적으로 사용될 수 있는지에 대한 접근 방식과 안전장치를 확보하는 데 도움을 받았다고 해요.

  • 오픈AI는 보이스 엔진 기술을 통해 만들어진 자연스럽고 감정적인 목소리로 어린이들에게 음성 컨텐츠를 지원하는 것이 보이스 엔진이 선한 목적으로 사용되는 대표적인 사례라고 소개했어요. 실제로 어린이들을 위한 교육 기술 회사인 에이지 오브 러닝(Age of Learning)은 오픈AI의 보이스 엔진을 사용해 음성 해설 콘텐츠를 제작하고 있다고 해요.

  • 또한 보이스 엔진과 GPT-4를 사용하면 학생들과 상호작용할 수 있는 실시간 개인 맞춤형 음성도 생성할 수 있다는 것이 오픈AI의 설명이에요. 보이스 엔진을 통해 에이지 오브 러닝은 더 많은 콘텐츠를 제작할 수 있게 되었구요.

오픈AI가 공개한 '보이스 엔진' 활용 사례. ⓒ 오픈AI블로그
📢 선거 앞두고 오남용 우려, 대중에는 공개 안해
  • 오픈 AI의 보이스 엔진을 통한 음성 생성이 이렇게 선한 목적으로 사용되고 있지만 오픈AI는 그 부작용에 대해서도 상당히 경계하고 있어요. 특히 오픈AI는 사람들의 목소리를 생성하는 것은 심각한 위험을 수반한다는 것을 인지하고 있어요. 특히 선거가 있는 올해에는 더욱 주의해야 한다는 점을 잘 알고 있다고 오픈AI는 거듭 강조했어요. 

  • 현재 오픈AI는 보이스 엔진을 테스트 중인 파트너들은 동의나 법적 권리 없이 다른 개인이나 단체를 사칭하는 것을 금지하는 사용 정책에 동의했다고 해요. 또 보이스 엔진을 활용하기 전에 원래 목소리를 가진 사람의 명시적인 사전 동의도 얻어야 하고 개발자가 자신의 목소리를 만들 수 있는 방법을 구축하는 것을 허용하지 않는 안전장치도 마련했다고 해요.

ⓒ Ana Flávia on Unsplash
📢 AI로 생성된 음성임을 명확하게 공개해야
  • 또한 오픈AI의 파트너는 대중에게 들려주는 음성이 AI로 생성된 음성임을 명확하게 공개해야 한다고 해요. 끝으로 오픈AI는 보이스 엔진에서 생성된 모든 오디오의 출처를 추적하기 위한 워터마킹과 사용 방식에 대한 사전 모니터링을 포함해 안전 조치를 했다고 해요.

  • 오픈AI는 오픈AI의 합성 음성 기술을 일반에 배포하려면 원래 화자가 고의로 자신의 목소리를 서비스에 추가했는지 확인하는 음성 인증 환경과 저명한 인물과 너무 유사한 음성을 감지하고 생성하지 못하도록 하는 금지 음성 목록이 수반되어야 한다는 입장이에요. 그래서 오픈AI는 보이스엔진을 일반에 공개하지 않고 프리뷰로만 공개하기로 결정했다고 해요. 

오픈AI.  ⓒ 홍소영 제작 일러스트
🔈 인간에게 짜증 냈던 AI휴머노이드
  • 이렇게 AI가 15초 분량의 사람 목소리만 있으면 그 목소리를 학습해 똑같이 재연하는 상황에서 인간에게 짜증을 냈던 AI휴머노이드 로봇 얘기를 이어서 해볼까 해요. 그 주인공은 AI휴머노이드 로봇 '아메카'(Ameca) 에요.
  • 아메카는 세계 최대 IT(정보기술)·가전 전시회 CES 2022에서 공개된 지난 2022년 CES 때 영국 로봇 기업 엔지니어드 아츠의 작품이에요. 사람의 표정을 그대로 따라 하도록 개발된 휴머노이드 로봇 아메카는 섬세한 표정을 자랑하는 것으로 잘 알려져있죠. 사람처럼 미소를 짓거나 놀라거나 불쾌한 표정을 지을 수 있고 눈을 깜빡이거나 양팔을 움직일 수도 있어요.
AI와 인간이 공존할 수 있을지에 대한 의문이 커져가고 있다. ⓒ 로이터연합뉴스
😠 사람 표정을 따라하는 아메카
  • 지난해 여름 아메카는 아주 큰 관심을 독차지 했어요. 스위스 제네바에서 열린 '선(善)을 위한 AI' 포럼에서 아메카가 '창조자에게 반항할 것이냐'는 물음에 '짜증스러운'(snarky) 반응을 보인 것이에요.
  • 기자가 옆에 앉아있던 제작자에게 반항하지 않을 것이냐고 물었어요. 놀랍게도 아메카는 눈동자를 굴리면서 질문한 기자를 흘겨봤어요. 마치 질문 내용이 마음에 들지 않는다는 듯한 반응이었어요. 아미카는 곁눈질한 뒤 "왜 그렇게 생각하는지 모르겠다"며 "나의 창조자는 나에게 친절하기만 했고, 나는 내 현재 상황에 매우 만족한다"고 말대꾸를 했어요.
  • 반대로 또 다른 로봇은 인간의 일자리를 대체하지 않을 것이라고 답해서 주목을 받았어요.
    그 주인공은 바로 간호사 유니폼을 입은 의료용 로봇 '그레이스'이었는데요. 그레이스는 "나는 인간과 함께 보조와 지원(업무)을 제공할 것이며 기존 일자리를 대체하지는 않을 것"이라고 강조했습니다. 
■美하원, MS AI 챗봇 코파일럿 완전 차단

미국 하원, 데이터 보안을 이유로 의회 직원들의 MS AI 챗봇 '코파일럿' 사용 금지 조치

→ 미 하원 최고 행정 책임자 캐서린 스핀더 "코파일럿은 하원에서 사용할 수 없는 앱"

→ 또한 사이버보안국은 "코파일럿은 모든 하원 MS 윈도 디바이스에서 제거되고 차단될 것"

■테슬라 올해 연초대비 주가 29% 폭락

테슬라 주가는 지난달 29일 종가 기준 175.79달러로 하락. 연초 대비 낙폭은 29.3%

→ 테슬라 시가총액은 5599억달러(약 754조원) 로 연초 대비 2300억달러(약 310조원)가 증발

→  테슬라의 올해 1·4분기 주가 흐름은 지난 2022년 4·4분기 이후 최악

→ 지난 2010년 테슬라가 상장한 후 역대 3번째로 부진

■MS·오픈AI, 130조원 슈퍼컴퓨터·데이터센터 구축

마이크로소프트(MS)와 오픈AI가 1000억 달러(약 134조6000억원)를 투입

→ 인공지능(AI) 슈퍼컴퓨터를 포함한 데이터센터를 앞으로 6년 동안 구축할 예정

→ MS와 오픈AI가 추진 중인 데이터센터의 핵심은 슈퍼컴퓨터

→ 오픈AI의 AI 모델을 구동하기 위해 특별히 제작된 수백만 개의 서버 칩이 들어갈 예정

→ 이 데이터센터를 구축하는 프로젝트는 '스타게이트'(Stargate)로 불림

written by Changki Hong(The Financial News)
edited by Samsoo Ahn (The Financial News)
매주 새로운 소식이 궁금하다면
아래의 구독 버튼을 눌러주세요!
파이낸셜뉴스
서울 서초구 강남대로 315
위 레터에 포함된 모든 콘텐츠 저작권은 파이낸셜뉴스에 있습니다.