📌 IT 주간 인기 뉴스
작은 언어모델이 맵다🌶️ sLLM
ChatGPT의 개발사 오픈AI가 새로운 대규모언어모델(LLM)인 'GPT-4o'를 공개했어요. 기존 모델이 텍스트로만 대화했던 것에 비해 새 모델은 텍스트와 음성, 이미지를 모두 처리할 수 있다고 하는데요. 영화에서만 보던 일이 정말 우리 일상에 가까워져 오는 것 같아요.
이렇게 생성형 AI의 기반이 되는 대규모언어모델, LLM(Large language model) 개발에 많은 빅테크 기업들이 앞장서고 있지만, 한편으로는 '눈물날 정도로' 비싼 비용 때문에 고민이 많다고 해요. LLM을 구동하기 위한 서버용 그래픽처리장치(GPU) 비용에다가 GPU를 가동하기 위한 전기세, 클라우드 운용비 등으로 지난해 상반기 기준 ChatGPT의 하루 운용 비용은 약 70만 달러(약 9억원)에 달했다고..!
그래서 많은 빅테크들이 소규모언어모델인 sLLM에 눈을 돌리고 있어요. 매개변수는 적지만 특화된 데이터로 가성비를 높이는 전략인데요. 최근 구글이 '제미나이 나노', 마이크로소프트가 '파이(Phi)-3 미니', 메타가 '라마3'라는 이름의 sLLM을 선보였어요. sLLM은 small Large language model의 약자로, 보다 저렴한 비용으로 응답 속도를 향상시킬 수 있어요.
이러한 장점으로 국내 기업들도 속속 sLLM을 내놓고 있는데요. 네이버는 하이버클로바X의 경량화 모델인 'HCX-대시', 업스테이지는 '솔라 미니', 파수는 '엘름'을 공개했어요. 미국 시장조사업체 밸류에이츠 리포트가 발간한 보고서에 따르면, sLLM 시장 규모는 2022년 51억 8000만 달러에서 오는 2029년 171억 8000만 달러로 성장할 전망이라고 해요. sLLM과 LLM 각각의 장단점이 있는 만큼 비즈니스에 맞는 모델을 선택하는 게 중요하겠네요. |