๐ซ ๋์น๋ฉด ์๋๋ ์ด๋ฒ์ฃผ AI ์์ TOP 3 2025๋
2์ 1์ฃผ์ฐจ ์
๋ ํธ์คํ ๋ด์ค๋ ํฐ |
|
|
๐ณ DeepSeek, ์ฐ๋ฆฌ๋ ๊น๊ฒ ์ดํด๋ณผ๊น์? |
|
|
์ค ์ฐํด ๋์ ์ ์ธ๊ณ๋ฅผ ๋คํ๋ ๋ด์ค๊ฐ ์์ต๋๋ค. ๋ฐ๋ก ์ค๊ตญ์ AI ์คํํธ์
DeepSeek(๋ฅ์ํฌ)๊ฐ ์ถ์ํ LLM ๋ชจ๋ธ์ธ R1์ ์ถ์ ์์์ธ๋ฐ์. R1์ ๋จ์ง ์ฑ๋ฅ์ด ๋ฐ์ด๋ ๊ฒ๋ฟ๋ง ์๋๋ผ, ๊ฒฝ์์ฌ๋ค์ ๋นํด ๋ฎ์ ๋น์ฉ์ผ๋ก ๊ฐ๋ฐ๋์์ต๋๋ค. ๊ฒ๋ค๊ฐ ๋ฌด๋ฃ๋ก ๊ณต๊ฐ๋์์ง์. ์ ์ฌํธ๋ง์ ๊ฒฝ์์ ์์ํ ๋ฏ, R1์ 'ํนํ๋ ๊ฐ๊ฒฉ ๋๋น ์ข์ ์ฑ๋ฅ'์ด๋ผ๊ณ ์ธ๊ธํ๋ฉฐ ์คํAI๋ '๋น์ฐํ ํจ์ฌ ์ข์ ๋ชจ๋ธ๋ค'์ ์ถ์ํ ์์ ์ด๋ผ๊ณ ํธ์์ ์ฌ๋ฆฌ๊ธฐ๋ ํ์ต๋๋ค.
|
|
|
์ ์ฌํธ๋ง์ ๊ฒฝ์์ฌ์ ๋ถ์ ๋ถ์ธ ๋ฅ์ํฌ์ ๋ชจ๋ธ์ ๋ํด ์์๋ณผ๊น์? ๐
|
|
|
DeepSeek: ๋ฌด์์ด ํน๋ณํ๊ฐ? |
|
|
๋ฅ์ํฌ๋ R1 ๋ชจ๋ธ์ ๊ณต๊ฐํ๋ฉฐ, ๊ธฐ์กด ๋ํ ์ธ์ด ๋ชจ๋ธ๋ค๊ณผ ๊ฒฝ์ํ ๋งํ ์ฑ๋ฅ์ ์๋ํ๋ฉด์๋ ์๋์ ์ผ๋ก ์ ๋ ดํ ๊ฐ๊ฒฉ์ผ๋ก ๊ฐ๋ฐํ์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๊ณต๊ฐ๋ ๋จ์ํ ๊ธฐ์ ์ ์ง์ ์ ์๋ฏธํ๋ ๊ฒ์ด ์๋๋ผ, AI ๋ชจ๋ธ ํ๋ จ์ ๋ฐฉ์๊ณผ ์ ๊ทผ ๋ฐฉ์๊น์ง ๋ฐ๊ฟ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ์์ฌํฉ๋๋ค.
- ๋น์ฉ ์ ๊ฐ๊ณผ ์ฑ๋ฅ ํฅ์
R1์ ๊ธฐ์กด ๋ชจ๋ธ๋ค์ด ์๋ฐฑ๋ง ๋ฌ๋ฌ ์ด์์ ๋น์ฉ์ ๋ค์ฌ ํ๋ จ๋๋ ๊ฒ๊ณผ๋ ๋ฌ๋ฆฌ, ํจ์ฌ ์ ์ ๋น์ฉ์ผ๋ก ๊ฐ๋ฐ๋์์ต๋๋ค. ๋ฅ์ํฌ๋ '๊ฐํ ํ์ต ์๋ํ'๋ผ๋ ํ์ ์ ์ธ ๋ฐฉ๋ฒ์ ํตํด ์ธ๊ฐ ํผ๋๋ฐฑ์ ์ต์ํํ๋ฉด์๋ ์ฐ์ํ ์ฑ๊ณผ๋ฅผ ๋ผ ์ ์์์ต๋๋ค.
๋ฅ์ํฌ๋ LLM์ ํ๋ จํ๋ ์ ํต์ ์ธ ๋ฐฉ๋ฒ์ ๋์ด์๋ ๋ฐฉ๋ฒ์ ์ ์ํ์ต๋๋ค. LLM์ ํ๋ จ ๊ณผ์ ์ ๋ ๊ฐ์ง ์ฃผ์ ๋จ๊ณ๋ก ๋๋ ์ ์์ต๋๋ค: ํ๋ฆฌํธ๋ ์ด๋(Pretraining)๊ณผ ํฌ์คํธํธ๋ ์ด๋(Post-training). ๋ฅ์ํฌ๋ ํฌ์คํธํธ๋ ์ด๋ ๊ณผ์ ์์ ์ธ๊ฐ์ ๊ฐ์
์ ์ต์ํํ๊ณ , ์ปดํจํฐ๊ฐ ์ค์ค๋ก ๋ชจ๋ธ์ ํ๊ฐํ๊ณ ํ์ตํ๋๋ก ํ์ต๋๋ค.
-
๊ฐํ ํ์ต์ ์๋ํ: ๋ฅ์ํฌ๋ ๊ฐํ ํ์ต์ ์๋ํํ์ฌ, ๊ธฐ์กด์ ์ธ๊ฐ์ด ์ง์ ๋ชจ๋ธ์ ๋ํ ํผ๋๋ฐฑ์ ์ ๊ณตํ๋ ๋จ๊ณ๋ฅผ ์๋ตํ์ต๋๋ค. ์ด ๋ฐฉ์์ ํนํ ์ํ๊ณผ ์ฝ๋ ๋ฌธ์ ์์ ๋ฐ์ด๋ ์ฑ๊ณผ๋ฅผ ๋ณด์์ผ๋ฉฐ, ๋น์ฉ ์ ๊ฐ์๋ ํฐ ๋์์ด ๋์์ต๋๋ค.
-
์๋ก์ด ์๊ณ ๋ฆฌ์ฆ: Group Relative Policy Optimization (GRPO): ๋ฅ์ํฌ๋ GRPO๋ผ๋ ์๋ก์ด ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํด ๋ชจ๋ธ ํ๋ จ์ ํจ์จ์ฑ์ ๊ทน๋ํํ์ต๋๋ค. ๊ธฐ์กด ๊ฐํ ํ์ต ๋ฐฉ๋ฒ๋ค์ ๋ณ๋์ ์์ธก ๋ชจ๋ธ์ด ํ์ํ์ง๋ง, GRPO๋ ์ถ๊ฐ์ ์ธ ๋ชจ๋ธ ์์ด๋ ํจ์จ์ ์ธ ํ๋ จ์ ๊ฐ๋ฅํ๊ฒ ํ๋๋ฐ์. GRPO๋ LLM์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํค๊ธฐ ์ํด ์ค๊ณ๋ ๊ฐํ ํ์ต ์๊ณ ๋ฆฌ์ฆ์
๋๋ค.
|
|
|
GRPO์ ๋ํด ๋ ์์๋ณด์! |
|
|
-
๊ธฐ๋ณธ ๊ฐ๋
: GRPO๋ ๊ฐํ ํ์ต์์์ ์ ์ฑ
์ต์ ํ ๋ฐฉ์์ ์๋ก์ด ๋ฐฉ์์ผ๋ก ์ ๊ทผํฉ๋๋ค. ์ ํต์ ์ธ ๊ฐํ ํ์ต ๋ฐฉ๋ฒ์ ๋ณ๋์ ๋นํ ๋ชจ๋ธ(critic model)์ ์ฌ์ฉํ์ฌ ์ ์ฑ
์ ํ๊ฐํ๊ณ , ์ด๋ฅผ ํตํด ํ์ต์ ์งํํฉ๋๋ค. ๊ทธ๋ฌ๋ GRPO๋ ๊ทธ๋ฃน ๋ด์ ์๋ต๋ค๋ผ๋ฆฌ ๋น๊ตํ์ฌ ์ฑ๋ฅ์ ํ๊ฐํ๊ณ , ์ด๋ฅผ ํตํด ์ ์ฑ
(policy)์ ์ต์ ํํ๋ ๋ฐฉ์์ ์ฑํํฉ๋๋ค. ์ฆ, ๋ชจ๋ธ์ ๊ทธ๋ฃน ๋ด ๋ค๋ฅธ ์๋ต๋ค๊ณผ ๋น๊ตํ์ฌ ์ฑ๊ณผ๋ฅผ ํ๋จํ๊ณ ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ต์ ํํ๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉํฉ๋๋ค.
- Proximal Policy Optimization (PPO)๊ณผ์ ๊ด๊ณ: GRPO๋ ๊ฐํ ํ์ต์์ ๋งค์ฐ ์ธ๊ธฐ ์๋ ๋ฐฉ๋ฒ ์ค ํ๋์ธ Proximal Policy Optimization (PPO)์ ๋ณํ์ผ๋ก ๋ถ๋ฅ๋๋๋ฐ์. PPO๋ ํด๋ฆฌํ(clipping) ๊ธฐ๋ฒ์ ์ฌ์ฉํ์ฌ ์ ์ฑ
์
๋ฐ์ดํธ์ ๊ธ๊ฒฉํ ๋ณํ๋ฅผ ๋ฐฉ์งํ๊ณ ์์ ์ ์ธ ํ์ต์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. GRPO๋ PPO์ ์ ์ฌํ ๋ฐฉ์์ผ๋ก ๋์ํ์ง๋ง, ๋นํ ๋ชจ๋ธ ๋์ ๊ทธ๋ฃน ๋ด ์ฑ๊ณผ ๋น๊ต๋ฅผ ์ฌ์ฉํ์ฌ ๋ ํจ์จ์ ์ธ ์ต์ ํ๊ฐ ๊ฐ๋ฅํฉ๋๋ค.
-
๊ณ์ฐ ๋ณต์ก๋ ๊ฐ์: GRPO๋ ์ ํต์ ์ธ ๊ฐํ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ๋นํด ๊ณ์ฐ ๋ณต์ก๋(computational complexity)๋ฅผ ํฌ๊ฒ ์ค์ผ ์ ์์ต๋๋ค. ์ด์ ๋ ๊ฐ์น ํจ์ ์ถ์ ๊ธฐ๋ฅผ ์ฌ์ฉํ์ง ์๊ธฐ ๋๋ฌธ์
๋๋ค. ์ ํต์ ์ธ ์๊ณ ๋ฆฌ์ฆ์์๋ ๊ฐ์น ํจ์ ์ถ์ ๊ธฐ๋ฅผ ํตํด ๋ชจ๋ธ์ด ๊ฐ ์ํ์ ๋ํ ๊ฐ์น๋ฅผ ํ๊ฐํด์ผ ํ์ง๋ง, GRPO๋ ์ด ๊ณผ์ ์ ์๋ตํ๊ณ ๊ทธ๋ฃน ๋ด ์๋์ ์ฑ๊ณผ๋ฅผ ์ฌ์ฉํ์ฌ ๊ณ์ฐ์ ๋ ๋จ์ํํฉ๋๋ค.
-
ํ์ต ์ฑ๊ณผ: GRPO๋ ๊ทธ๋ฃน ๋ด์ ์๋์ ์ธ ์ฑ๊ณผ๋ฅผ ์ต์ ํํ๋ฏ๋ก, ๋ชจ๋ธ์ ๋ ํจ์จ์ ์ผ๋ก ํ์ตํ ์ ์์ต๋๋ค. ์ด๋ ํนํ LLM์์ ์ค์ํ๋ฐ์. LLM์ ๋งค์ฐ ๋ณต์กํ ์๋ต์ ์์ฑํ๊ณ ์ด๋ฅผ ํ๊ฐํ๋ ๊ณผ์ ์ด ์ค์ํ ํ์ต ์์์ด๊ธฐ ๋๋ฌธ์
๋๋ค.
|
|
|
๋น ๋ฅด๊ฒ ์น๊ณ ์ฌ๋ผ์ค๋ DeepSeek |
|
|
๋ฅ์ํฌ์ R1 ๋ชจ๋ธ์ ๊ฐ๊ฒฉ ๋๋น ์ฑ๋ฅ์์ ํฐ ์ฃผ๋ชฉ์ ๋ฐ์ผ๋ฉฐ, AI ์ฐ์
์ ์๋ก์ด ๊ฒฝ์ ๊ตฌ๋๋ฅผ ํ์ฑํ๊ณ ์์ต๋๋ค. ์๋
์ ๋ฐํํ V3 ๋ชจ๋ธ๊ณผ, ์ผ๋ง ์ ๋ฐํํ R1 ๋ชจ๋ธ์ ๊ฐ๋ณ๊ฒ ์ดํด๋ณผ๊น์?
- V3: V3 ๋ชจ๋ธ์ OpenAI์ GPT-4์ ๋น๊ต๋ ์ ๋๋ก ๋ฐ์ด๋ ์ฑ๋ฅ์ ์๋ํ๋ฉฐ, ์ต์ Nvidia H800 ์นฉ์ ์ฌ์ฉํ์ฌ ํ๋ จ๋์์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ํ๋ จ์ ๋๋ ๋น์ฉ์ 6๋ฐฑ๋ง ๋ฌ๋ฌ ์ดํ๋ก ์ค์์ผ๋ฉฐ, ๋น์ฉ ๋๋น ์ฑ๋ฅ์์ ํฐ ์ฃผ๋ชฉ์ ๋ฐ๊ณ ์์ต๋๋ค.
- R1: R1 ๋ชจ๋ธ์ ์ต์ ๋ชจ๋ธ๋ก, ๋
ผ๋ฆฌ์ ์ฌ๊ณ ์ ์ํ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์
๋๋ค. R1์ ๋น์ฉ ํจ์จ์ฑ์ด ๋ฐ์ด๋ ๋ชจ๋ธ๋ก, OpenAI์ GPT-3 ๋ชจ๋ธ๋ณด๋ค 20๋ฐฐ์์ 50๋ฐฐ ์ ๋ ดํ๊ฒ ์ฌ์ฉํ ์ ์๋ค๊ณ ์๋ ค์ ธ ์์ต๋๋ค. ์ด ๋ชจ๋ธ์ ๊ฐํ ํ์ต ์๋ํ ๋ฐฉ์์ ์ฑํํ์ฌ, ์ธ๊ฐ์ ๊ฐ์
์ ์ต์ํํ๋ฉด์๋ ์ฐ์ํ ์ฑ๊ณผ๋ฅผ ๋ด๊ณ ์์ต๋๋ค.
๋ค๋ง ํ ๊ฐ์ง, ๊ฒ์ด ๋ฌธ์ ๊ฐ ๋
ผ๋์ด ์์ต๋๋ค. ๋ฅ์ํฌ์ R1 ๋ชจ๋ธ์ ํน์ ๋ฏผ๊ฐํ ์ฃผ์ ์ ๋ํด ๊ฒ์ด์ ์ ์ฉํ๊ณ ์๋ค๋ ์ ์์ ์ผ๋ถ ๋
ผ๋์ด ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ๋๋ง์ด๋ ์ฒ์๋ฌธ ๊ด๋ จ ์ง๋ฌธ์ ๋ํด์๋ ๋ต๋ณ์ ๊ฑฐ๋ถํ๊ฑฐ๋ ์ ํ์ ์ผ๋ก ์๋ต์ ์ ๊ณตํฉ๋๋ค. ์ด๋ ์ค๊ตญ ์ ๋ถ์ ๋ฒ์ ์๊ตฌ์ฌํญ์ ๋ฐ๋ผ ์ด๋ฃจ์ด์ง ๊ฒ์ผ๋ก, ์ค๊ตญ ๋ด์์๋ AI ๋ชจ๋ธ์ด ๋ฐ๋์ ์ ๋ณด ํต์ ๋ฅผ ์ค์ํด์ผ ํ๊ธฐ ๋๋ฌธ์ด์ง์. ์ด๋ฌํ ๊ฒ์ด ๊ธฐ๋ฅ์ ๋ฅ์ํฌ์ ๊ณต์ ์ฑ์ ํตํด ์ฌ์ฉ๋ ๋๋ง ๋ํ๋๋ฉฐ, ์คํ ์์ค ๋ฒ์ ์์๋ ์ผ๋ถ ์ฐํ๊ฐ ๊ฐ๋ฅํ๋ค๋ ์ ์์ ๊ธ๋ก๋ฒ ์ฌ์ฉ์๋ค์ ๊ด์ฌ์ ๋๊ณ ์์ต๋๋ค.
|
|
|
์ต๊ทผ ๋ฅ์ํฌ ์ฑ์ Apple์ ๋ฏธ๊ตญ App Store์์ ChatGPT๋ฅผ ์ ์น๊ณ 1์๋ฅผ ๋ฌ์ฑํ์ต๋๋ค. ๊ตญ๋ด์์๋ ์ฃผ๊ฐ ์ฌ์ฉ์๊ฐ 120๋ง๋ช
์ ๋ํํ๋ฉฐ ChatGPT ์ด์ด 2์๋ฅผ ๋ฌ์ฑํ๋๋ฐ์. ํ์ฌ ์ค๊ตญ ์ ๋ถ๋ ๋ฅ์ํฌ์ ์ฑ๊ณต์ AI ์๋ฆฝ ๋ชฉํ์ ์ค์ํ ์ด์ ํ๋ก ๋ณด๊ณ ์์ต๋๋ค. ๋ฏธ๊ตญ์ด AI ์ ์์ ์ถ์ฌํ๋ฅผ ๋์ง์๋ง์ ๋ฐ๋ก ์ค๊ตญ์ ๊ธฐ์ต ๊ณต๊ฒฉ์ด ์์๋์๋๋ฐ์. ๋ถ๋ ์๋ก์ ํ์ ์ ์ฐพ๊ธฐ๋ณด๋ค๋ ์ ์์ ๊ฒฝ์์ด ๋๊ธฐ๋ฅผ, ๊ทธ๋ฆฌ๊ณ ๋ฌด์๋ณด๋ค ์์ ํ AI๋ฅผ ์ํ ๊ณ ๋ฏผ๊ณผ ๋
ธ๋ ฅ์ด ์ฐ์ ์ ๋๊ธฐ๋ฅผ ๋ฐ๋ ๋ฟ์
๋๋ค. ๐ |
|
|
: ๋ฅ์ํฌ๋ ์ ๋น์ฉ์ผ๋ก ๊ณ ์ฑ๋ฅ AI ๋ชจ๋ธ์ ๊ฐ๋ฐํด ๋ฏธ๊ตญ์ ์ํํ๊ณ ์๋๋ฐ์. ์คํAI๋ ๋ฅ์ํฌ๊ฐ ์์ฌ์ ๋
์ ๋ชจ๋ธ์ ๋ฌด๋จ์ผ๋ก ์ฌ์ฉํ๋ค๋ ์ํน์ ์ ๊ธฐํ์ต๋๋ค. ๋ฏธ๊ตญ์ ๋ฅ์ํฌ์ ์ฑ์ฅ์ ์ต์ ํ๊ธฐ ์ํด ์์ถ ํต์ ๋ฅผ ๊ฐํํ๋ ค๊ณ ํ์ง๋ง, ์ผ๋ถ ์ ๋ฌธ๊ฐ๋ค์ ์ด๋ฌํ ์กฐ์น๊ฐ ์คํ๋ ค ์ค๊ตญ์ AI ํ์ ์ ์ด์งํ ๊ฒ์ด๋ผ๊ณ ๋ถ์ํ๊ณ ์์ต๋๋ค.
๋ฅ์ํฌ์ ํ๋ฐฉ ๋จน์ ์คํAI, โ๋ฅ ๋ฆฌ์์นโ๋ก ๋ง๋ถโฆ โ์ค์๊ฐ ์น ํ์ ๊ฐํโ
: ์คํAI๊ฐ ์ค๊ตญ์ AI ๋ชจ๋ธ ๋ฅ์ํฌ์ ๋์ํด ์๋ก์ด ๊ฒ์ ๋ฐ ์ฐ๊ตฌ ๋๊ตฌ '๋ฅ ๋ฆฌ์์น'๋ฅผ ๊ณต๊ฐํ์ต๋๋ค. ๋ฅ ๋ฆฌ์์น๋ ์น์ ํ์ํ๊ณ ์ฌ์ธต ๋ถ์์ ํตํด ๊ณ ๊ธ ์ฐ๊ตฌ ๋ณด๊ณ ์๋ฅผ ์์ฑํ๋๋ฐ์. ๋ฅ์ํฌ์ ์คํ์์ค ๋ชจ๋ธ์ด ๊ธ๋ถ์ํ๋ ๊ฐ์ด๋ฐ ์คํAI๋ ์ค์๊ฐ ์น ํ์๊ณผ ๋ค๋จ๊ณ ์ถ๋ก ๊ธฐ๋ฅ์ผ๋ก ๊ฒฝ์๋ ฅ์ ๊ฐํํ๊ณ ์ ํฉ๋๋ค.
์คํAI, AI ๋จ๋ง๊ธฐยท์๋ฒ ์นฉ์ ๋ก๋ดยท์์ ์ปดํจํ
๋ ๊ฐ๋ฐ?
: ํ
ํฌํฌ๋ฐ์น๋ ์คํAI๊ฐ ์ต๊ทผ ์ํ ๋ฑ๋ก ์ ์ฒญ์๋ฅผ ์ ์ถํ๋ฉฐ AI ์ ์ฉ ํ๋์จ์ด ๊ฐ๋ฐ์ ์ฐฉ์ํ๋ค๊ณ ๋ฐํ์ต๋๋ค. ์ ์ฒญ์์๋ ํด๋จธ๋
ธ์ด๋ ๋ก๋ด, ๋ง์ถคํ AI ์นฉ, ์์ ์ปดํจํ
์์ ํ์ฉ ๋ฑ์ด ํฌํจ๋์ด ์๋ค๋๋ฐ์. ์คํAI์ AI ํ๋์จ์ด ๊ฐ๋ฐ ๋ฐฉํฅ์ ๋ํ๋ธ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. ๋ํ ์ ์ฌํธ๋จผ CEO๋ ๋
์ ์นฉ ๊ฐ๋ฐ๊ณผ AI ์ ์ฉ ๋จ๋ง๊ธฐ ์ถ์๋ฅผ ์๊ณ ํ๋ฉฐ, ์ ํ ๋์์ด๋ ์ถ์ ์ ์กฐ๋ ์์ด๋ธ์ ํ์
์ค์์ ๋ฐํ์ต๋๋ค.
|
|
|
The Data-centric AI company
AI ๋ฐ์ดํฐ์ ๊ธฐ์ค์ ๋ง๋ญ๋๋ค
|
|
|
๐ ์ฌ์
๋ฐ ์ ํด ๋ฌธ์ contact@selectstar.ai
๐จ ์ฝํ
์ธ ๋ฐ ํ์ฌ ๋ฌธ์ marketing@selectstar.ai
|
|
|
|
|