State of AI Report 22 리뷰
AI 도입부터 Dataset구축까지 
All in One
AI DATA SOLUTION- SELECTSTAR
어느덧 2022년도 두 달 남았습니다

지난 한주 가장 HOT 한 AI NEWS, 
절대 놓쳐서는 안되는 AI TRENDS. 
SELECTSTAR가 큐레이션해서  
빠르게 전해드립니다

#AI트랜드 #AI뉴스 #코리아스타트업100 #ETRI #셀렉트스타

셀렉트스타,

100대 AI 스타트업

2년 연속 선정

불특정 다수가 작업을 하는 크라우드소싱, 카이스트 박사진이 개발한 수학적 알고리즘과 일관된 가이드라인을 제시함으로써 해결

인공지능 학습데이터 올인원 플랫폼 셀렉트스타가 지난해에 이어 올해도 ‘코리아 AI 스타트업 100(KOREA AI START UP 100)’에 2년 연속으로 선정됐습니다.


우수기업 평가는 카이스트·KT경제경영연구소가 공동 개발한 AI 스타트업 평가 모델을 활용해 진행되었는데 AI 시장 내 성장 및 확장 가능성, 기술력과 전문성 등의 정량적 지표와 함께, 기업 인지도 및 지속성, 기업 가치 등 정성적 평가를 더해 각 기업의 역량을 평가했다고합니다. 총 600여 개의 AI 스타트업이 지원했고, 최종 선정된 100개의 기업이 19일 콜로키움 행사에서 공표 되었습니다.

데이터 가공 부문에 선정된 셀렉트스타는 인공지능 학습데이터 수집, 가공 플랫폼으로서 높은 퀄리티의 데이터셋으로 인공지능 업계에서 주목받고 있는 유망 스타트업이며 올해 시리즈 A 익스텐션 라운드에서 총 누적 투자 134억원을 받으며 가파른 성장을 이어가고 있습니다.


코리아 AI 스타트업 100 더 알아보기 →

자율성장 인공지능 경진대회 FASHION-HOW, 아이언맨의 자비스처럼 소통 가능한 인공지능을 만들어보자!


자율성장 인공지능 경진대회 FASHION-HOW는 ETRI가 제공하는 ‘AI 패션 코디네티어 데이터셋’ FASCODE(FASHION COORDINATION DATASET)를 활용한 리더보드 챌린지입니다.

세번째를 맞이한 이번 패션하우 경진대회는 지난 대회들과는 달리 4개의 Tasks로 대회가 운영되었는데요, Task는 다음과 같습니다.

 

Sub-Task 1: [Fashion Image Attribute Classification]

  • 정의: 이미지 분류 및 패션 이미지 속성 분류
  • 목표: 입력된 패션 이미지를 사전에 정의된 3가지의 의류 속성 (일상성, 성, 장식성)들에 대해 각각 분류하기

 

Sub-Task 2: [Imbalanced Classification]

  • 정의: 불균형 데이터 분류 기술
  • 목표: 패션 데이터 내 불균형한 색상 카테고리 분류하기

 

Sub-Task 3: [Continual Learning]

  • 정의: 패션 코디네이션에서의 연속 학습
  • 목표: 패션 코디네이션 도메인의 여러 과업 (task)이 순차적으로 입력 및 학습되는 상황에서, 각각의 과업에 따른 적절한 패션 코디네이션을 생성하는 단일 패션 코디네이터 구축하기

 

Sub-Task 4: [Zero-Shot Learning]

  • 정의: 패션 코디네이션에서의 제로샷 학습
  • 목표: 학습되지 않은 패션 아이템을 포함한 패션 코디네이션 생성하기

최대 6인이 팀을 이뤄 원하는 Task에 리더보드를 제출하고 점수를 평가 받는 방식으로 대회가 진행되었습니다.

    AI Topic  → →
2022년 가장 핫한 AI 연구들

Welcome to State of AI Report 2022

출처:  https://www.stateof.ai/2022-report-launch.html


Computer Vision에 Transformer의 습격

이미지를 주로 다루는 컴퓨터 비전 영역에는 CNN이 주류를 차지해왔습니다. 하지만 요즘 Transformer 블럭을 근간으로 한 모델을 속속들이 등장하고 있습니다. Transformer는 자연어 처리 분야, 그중에서도 기계 번역 분야에서 줄곧 활용되어 왔습니다. 하지만 2020년대 들어서 점차 컴퓨터 비전을 비롯한 기타 영역으로 확장하더니 이제는 거의 모든 분야에서 Transformer를 찾아볼 수 있습니다.

Zeta Alpha의 연구에 따르면 Transformer가 활용되는 빈도는 텍스트에서 41%, 이미지에서 22%라고 합니다. 2020년대 이전에 텍스트에서 80%를 넘게 차지했던 것에 비하면 확실히 범용적으로 활용되고 있음을 알 수 있습니다.


Diffusion 모델은 GAN을 대체할 것인가?

이미지 생성 모델로 가장 대표적인 것이 2014년에 공개된 GAN 모델이었는데요, 이제는 이미지 생성의 왕좌를 넘겨줄 것 같습니다. 근래 가장 뜨거운 감자였던 Text-to-Image의 핵심을 이루고 있는 모델은 Diffusion입니다. Diffusion 모델은 기존 이미지에 노이즈를 조금씩 추가하고, 다시 노이즈를 없애며 복원하는 과정에서 이미지의 특성을 학습하는 것이 특징입니다. 이렇게 디노이징(denoising)하는 과정은 느릴 수밖에 없지만 점차 학습 추론 속도가 개선되고 뛰어난 양질의 결과물을 보여주면서 점차 주목 받고 있는 모델입니다.

그리고 이제 Diffusion은 다른 영역을 넘보고 있습니다. 앞서 설명한 Transformer가 NLP에서 Vision으로 넘어왔다면, Diffusion은 Vision에서 NLP로 확장되고 있습니다. 여기서 그치지 않고 오디오나 비디오 등 다양한 분야로 확장할 수 있는 가능성까지 기대해볼 수 있을 것 같습니다.


Text-to-Image 열풍, 그리고 Text-to-Video의 등장

Text-to-Image가 이제 일반인들에게 공개되었습니다. Stability.ai에서 공개한 Stable Diffusion이 오픈 소스로 공개되면서 많은 사람들이 다양한 작품을 만들어내고 SNS에 공유하고 있습니다.

사실 Text-to-Image는 2021년 1월에 공개된 DALL-E가 서막을 열었습니다. 불과 15개월만에 DALL-E mini를 통해 일반인들에게 공개되었고, 얼마 지나지 않아 고품질의 Text-to-Image 모델의 시대가 보편화되었습니다.

이런 열풍에 뒤이어 Google과 Meta에서는 Text-to-Video 모델을 선보였습니다. 각각 9월 말과 10월 초, Meta는 Make-A-Video를, Google은 Imagen Video를 공개합니다. 아직은 짤막한 영상을 만들어내는 수준이지만 이 역시 1-2년 뒤에는 현재의 Stable Diffusion처럼 뛰어난 퀄리티로 공개될지도 모르겠습니다.


3D의 시대가 온다, NeRF의 급성장

NeRF는 2D 이미지를 3D로 렌더링하는 모델입니다. 간단히 설명하자면, 인간이 여러 각도에서 어떤 물체를 보고 그것이 어떻게 생겼는지 상상할 수 있는 것처럼 NeRF도 촬영한 2D 이미지를 기반으로 보이지 않는 곳을 예측하고 보간을 통해 완성도 높은 3D 모델을 렌더링하는 것입니다.

2020년, NeRF의 성능이 비약적으로 개선되었고 이후 NeRF와 관련된 연구가 급성장하고 있습니다. 올 한 해에만 NeRF와 관련된 논문들이 약 1000개 가까이 쏟아져 나왔습니다.

올해에는 100배 빠르게 학습하는 방법, 더 적은 이미지로 렌더링 하는 방법, 더 고화소로 렌더링하는 방법 등이 제안되었습니다. 심지어는 도시나 우주의 단위를 생성해내기도 했다고 하네요.

NeRF를 응용한 3D 분야도 점차 확대되고 있습니다. 앞으로는 3D 생성과 관련된 모델과 연구 분야가 점차 더 확장될 것으로 보입니다.


LLM과 함께 발전하는 분야들

LLM(Large Language Model)들이 등장하면서 점차 하위 분야도 확장되고 있습니다. 2021년 구글에서 발표한 PaLM은 올해 수학 문제를 푸는 Minerva라는 모델에 활용되었습니다. 기존 PaLM 모델 구조에 수학 기호들을 이해할 수 있도록 새로운 데이터로 학습을 진행했고, 그 결과 정말 문제를 이해하고 답을 내는 듯 보였습니다. 물론 아직 완벽한 정도는 아니지만 수학 문제와 같은 분야에 인공지능이 발을 들일 수 있음을 보여주기도 했습니다.


로보틱스 분야에서도 다양한 상황에서 로봇이 정확하게 명령을 이해할 수 있도록 언어 체계를 학습시킬 필요가 있습니다. 여기에서 LLM이 중요한 역할을 합니다. SayCan은 인간의 명령에 따라서 행동합니다. 다만 정확하게 행동을 지시하는 것이 아니라, 마치 인간처럼 ‘나 음료를 쏟았는데, 도와줘’라고 하면 닦을 것을 갖다주는 식입니다. 이때 닦을 것을 갖다달라고 하지 않아도 돕는 행위를 했다는 것이 핵심이지요. 특히 이미지를 기반으로 한 맥락을 잘 이해하고 올바르게 행동하는 것이 중요합니다. 여기에서도 PaLM이 SayCan에 적용되어, 인간의 명령을 맥락에 맞게 잘 이해할 수 있도록 도와줍니다.


출처: SayCan(Michael, 2022)에서 캡처

작년 말에 공개된 LLM을 기반으로한 챗봇 LaMDA도 올해 초 논문이 공개되었습니다. 구글 내부 관계자 중 한 명이 LaMDA와의 대화를 공개하면서 인공지능이 감정을 가지고 있다고 폭로하며 이슈가 되기도 했습니다. 그만큼 자연스러운 대화가 가능할 정도로 챗봇의 수준이 많이 올라왔습니다. 이처럼 LLM이 성장함에 따라 자연어를 활용한 분야들이 크게 성장해나가고 있습니다.
이밖에도 과학계에서 발전을 촉진하고 있는 AI 연구(AlphaFold), 환경을 고려하는 연구 등이 올해의 키워드로 선정되었습니다.


2022년에는 전반적으로 컴퓨터 비전 분야의 발전이 돋보입니다. 이미지 생성과 3D 렌더링의 부상 등 다양한 컴퓨터 비전 내에서 다양한 분야로 확장되고 있는 것 같고 자연어 처리 분야는 점차 일상 속으로 스며들고 있는듯 합니다.

Weekly AI Issues  → →

약 1400억 원 투자 받은 Stability AI

Stability AI, the startup behind Stable Diffusion, raises $101M

완성도 높은 그림 실력을 보여줬던 Stable Diffusion이 뜨거운 감자로 급부상했습니다. Stable Diffusion을 만든 Stability AI의 가치도 덩달아 올라갔는데요, 테크크런치에 따르면 최근 101M 달러(한화 약 1400억 원)를 투자 받았다고 합니다. 잘 만든 기술 하나가 기업을 살리네요.

AI가 쓴 유발 하라리 <사피엔스> 서문

'사피엔스' 서문 보고 깜짝 놀란 하라리..."AI가 이 글을 썼다고?" | 연합뉴스

"현재 우리가 마주한 커다란 도전 과제는 세계적인 규모로 새로운 상상 속의 질서를 만들되 국민국가나 자본주의 시장에 기초하지 않는 것이다.” 이 난해한 문장은 ‘사피엔스 10주년 특별판’에 실린 서문입니다. 이 글은 OpenAI가 개발한 GPT-3가 쓴 문장이라고 하는데요. ‘사피엔스’의 저자 유발 하라리는 이 결과에 놀라면서 이런 기술들을 움직일 힘을 ‘지혜롭게 사용하는 것은 우리의 삶에 결정적으로 중요하다’고 밝혔습니다.

AI 가상 인간의 초상권 논란

'8억 AI 인간' 여리지=레드벨벳 아이린? 초상권 논란 시끌 [종합]

AI가 만든 가상인간 기술이 점차 고도화되고 있습니다. 불쾌한 골짜기를 넘어 실제 사람 같아서 초상권 논란까지 불거지고 있습니다. 이번 한국관광공사 국정감사에서 가상인간 ‘여리지’가 레드벨벳의 아이린을 닮았다는 문제가 제기되었습니다. 가상인간은 초상권을 침해한 것일까요? 그리고 가상인간의 초상권을 인정받을 수 있을까요?

마약 잡는 AI

단속 까다로운 신종마약 '인공지능'으로 잡는다

서강대학교와 대검찰청 과학수사부가 함께 개발한 알고리즘이 실제 현장에서 신종 마약을 검출하는 데 도움을 주고 있다고 합니다. 마약 잡는 AI가 마약 단속에 적용된 사례는 세계 최초라고 합니다.

삼성 AI 포럼 2022 개최

삼성전자, '삼성 AI 포럼 2022' 11월 개최

삼성전자에서 ‘삼성 AI 포럼 2022’를 11월 8일과 9일, 양일간 개최합니다. 국내외 석학들이 참석하여 최신 AI 알고리즘 연구성과를 소개하고 우수 논문 포스터 발표 등이 진행된다고 합니다.

     Promotion  → →
*셀렉트스타는
실무에 바로 활용할 수 있는
오픈 데이터셋 자료를
 무료로 제공해드립니다
셀렉트스타 주식회사
📨  비즈니스 문의 및 제휴 contact@selectstar.ai
서울특별시 강남구 역삼동 테헤란로 20길 20 8층, 10층, 11층
1666-3282 (1666-DATA)

*본 콘텐츠는 deep daiv. 와의 제휴로 구성 되었습니다.