#Codestral #MMLU-Pro
ํ•จ๊ป˜ ๊ณต์œ ํ•˜๊ณ  ์„ฑ์žฅํ•˜๋Š” ์—ฐ๊ตฌ ๋ฌธํ™”๋ฅผ ์ „ํŒŒํ•ด์š”
2024๋…„ 6์›” 10์ผ ๋ชจ๋‘๋ ˆํ„ฐ
created with ChatGPT-4o
๋‹˜, ๋ชจ๋‘๋ ˆํ„ฐ๊ฐ€ ์™”์–ด์š”!
๋‹˜ ๊ทธ๋™์•ˆ ์ž˜ ์ง€๋ƒˆ์–ด์š”?
๋ฒŒ์จ ๋ฌด๋”์œ„๊ฐ€ ์ฐพ์•„์˜ค๋Š” ๋“ฏ ํ•œ๋ฐ์š”.
๋ด„์œผ๋กœ ๋Œ์•„๊ฐ€๊ณ  ์‹ถ์€ ๋งˆ์Œ์ด ๊ตด๋š๊ฐ™์•„์š”..๐Ÿ˜ฃ
์šฐ๋ฆฌ ๊ฐ™์ด ํ•œ์—ฌ๋ฆ„ ๋”์œ„ ๋ฏธ๋ฆฌ ์ž˜ ์ค€๋น„ํ•ด์š”!~
์ด๋ฒˆ์ฃผ SW/AI ์†Œ์‹ 
  • ๋ฏธ์ŠคํŠธ๋ž„ AI, ์ฒซ ์ฝ”๋“œ ์ƒ์„ฑ ๋ชจ๋ธ '์ฝ”๋“œ์ŠคํŠธ๋ž„' ๊ณต๊ฐœ
  • ํ•œ์ธต ์—…๊ทธ๋ ˆ์ด๋“œ๋œ MMLU ๋ฒค์น˜๋งˆํฌ
์—ด๋ฆฐ ์„ธ๋ฏธ๋‚˜: ๐Ÿ’ก๋Ÿฐ ํ”„๋กœ์ ํŠธ ์—ญ๊ธฐํš A-Z (1ํšŒ์ฐจ)
๋ฏธ์ŠคํŠธ๋ž„ AI, ์ฒซ ์ฝ”๋“œ ์ƒ์„ฑ ๋ชจ๋ธ '์ฝ”๋“œ์ŠคํŠธ๋ž„' ๊ณต๊ฐœ
ยฉMistral AI
Mixture-of-Experts(MoE) ๊ธฐ๋ฒ•์„ ์ ์šฉํ•œ ์–ธ์–ด ๋ชจ๋ธ ๋ฏน์ŠคํŠธ๋ž„(Mixtral)๋กœ ์ž˜ ์•Œ๋ ค์ ธ ์žˆ๋Š” ์ธ๊ณต์ง€๋Šฅ ์Šคํƒ€ํŠธ์—… ๋ฏธ์ŠคํŠธ๋ž„ AI(Mistral AI)์—์„œ ์ฝ”๋“œ ์ƒ์„ฑ ๋ชจ๋ธ '์ฝ”๋“œ์ŠคํŠธ๋ž„(Codestral)'์„ ์ถœ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฏธ์ŠคํŠธ๋ž„ AI์—์„œ ์ฒ˜์Œ์œผ๋กœ ์ถœ์‹œ๋œ ์ฝ”๋“œ ์ƒ์„ฑ ๋ชจ๋ธ์ธ๋ฐ์š”. ํŒŒ์ด์ฌ์ด๋‚˜ ์ž๋ฐ”์™€ ๊ฐ™์ด ๋„๋ฆฌ ์“ฐ์ด๊ณ  ์žˆ๋Š” ์–ธ์–ด๋ถ€ํ„ฐ ์Šค์œ„ํ”„ํŠธ(Swift), ํฌํŠธ๋ž€(Fortran) ๋“ฑ 80๊ฐ€์ง€ ์ด์ƒ์˜ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๋กœ ํ•™์Šต๋๋‹ค๊ณ  ํ•ด์š”.

์ฝ”๋“œ์ŠคํŠธ๋ž„์˜ ๋ชจ๋ธ ํฌ๊ธฐ๋Š” 22B(ํŒŒ๋ผ๋ฏธํ„ฐ 220์–ต ๊ฐœ)์ง€๋งŒ, ์ฝ”๋“œ๋ผ๋งˆ 70B(CodeLlama 70B), ๋”ฅ์‹ ์ฝ”๋” 33B(DeepSeek Coder 33B) ๋“ฑ ๊ทœ๋ชจ๊ฐ€ ๋” ํฐ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•ด๋„ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค๊ณ  ํ•˜๋„ค์š”. ์ฝ”๋“œ์ŠคํŠธ๋ž„ ๋ชจ๋ธ์€ ๋ฏธ์ŠคํŠธ๋ž„์—์„œ ์ œ๊ณตํ•˜๋Š” API๋ฅผ ํ†ตํ•ด์„œ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๊ณ ์š”. ์ฑ—๋ด‡ ์„œ๋น„์Šค '๋ฅด ์ฑ—(Le Chat)'์—์„œ๋„ ๋ชจ๋ธ๊ณผ ๋Œ€ํ™”ํ•ด ๋ณผ ์ˆ˜ ์žˆ์œผ๋‹ˆ ์ฐธ๊ณ ํ•ด ์ฃผ์„ธ์š”!

ํ•œ์ธต ์—…๊ทธ๋ ˆ์ด๋“œ๋œ MMLU ๋ฒค์น˜๋งˆํฌ

MMLU(Massive Multitask Language Understanding)๋Š” ์ˆ˜ํ•™, ๋ฒ•๋ฅ  ๋“ฑ 57๊ฐ€์ง€ ์ฃผ์ œ์™€ ๊ด€๋ จ๋œ ๊ฐ๊ด€์‹ ๋ฌธ์ œ๋กœ ์ด๋ฃจ์–ด์ง„ ๋ฐ์ดํ„ฐ์…‹์ธ๋ฐ์š”. ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์˜ ์ง€์‹์„ ์ดํ•ดํ•˜๊ณ  ์ถ”๋ก ํ•˜๋Š” ๋Šฅ๋ ฅ์„ ํ…Œ์ŠคํŠธํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์–ด์„œ, ์–ธ์–ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ๋กœ ๋„๋ฆฌ ์ด์šฉ๋˜์–ด ์™”์–ด์š”.

ํ•˜์ง€๋งŒ ๊ทธ๋™์•ˆ ์–ธ์–ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์ด ๋งŽ์ด ํ–ฅ์ƒ๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์—, ์ตœ์‹  ๋ชจ๋ธ์€ MMLU(๋Œ€๊ทœ๋ชจ ๋‹ค์ค‘ ์–ธ์–ด ์ดํ•ด) ์ ์ˆ˜๋กœ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•˜๋Š” ๊ฒƒ์ด ์ ์  ๋ฌด์˜๋ฏธํ•˜๊ฒŒ ๋˜์—ˆ๋Š”๋ฐ์š”. ์›Œํ„ธ๋ฃจ ๋Œ€ํ•™์˜ ์—ฐ๊ตฌํŒ€์€ MMLU ๋ฐ์ดํ„ฐ์—์„œ ์ถ”๋ก  ์ชฝ์„ ๊ฐ•ํ™”ํ•˜๊ณ  ์„ ํƒ์ง€๋ฅผ 4๊ฐœ์—์„œ 10๊ฐœ๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•œ 'MMLU-Pro' ๋ฐ์ดํ„ฐ์…‹์„ ๊ณต๊ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. GPT-4o, ํด๋กœ๋“œ 3(Claude 3) ๋“ฑ ์ตœ์‹  ๋ชจ๋ธ์„ MMLU-Pro๋กœ ํ…Œ์ŠคํŠธํ•œ ๊ฒฐ๊ณผ MMLU์— ๋น„ํ•ด ์ •๋‹ต๋ฅ ์ด 16%-33% ๋‚ฎ์•„์กŒ๊ณ , ํ”„๋กฌํ”„ํŠธ์— ๋ณ€ํ˜•์„ ์ฃผ์—ˆ์„ ๋•Œ๋„ ์ ์ˆ˜๊ฐ€ ์•ˆ์ •์ ์œผ๋กœ ๋‚˜์™”๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ“์ถ”์ฒœ ์•„ํ‹ฐํด  #์˜ˆ๋น„๊ฐœ๋ฐœ์ž #์ทจ์ค€์ƒ

Python ๋…ํ•™๋งŒ์œผ๋กœ ๊ฐœ๋ฐœ์ž๊ฐ€ ๋  ์ˆ˜ ์žˆ์„๊นŒ?

๋งŽ์€ ๋ถ„๋“ค์ด ๊ฐœ๋ฐœ ์ฒซ๊ฑธ์Œ ๋‹จ๊ณ„์—์„œ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด 'ํŒŒ์ด์ฌ(Python)'์„ ๊ฐ€์žฅ ์„ ํ˜ธํ•˜๋Š”๋ฐ์š”. ํŒŒ์ด์ฌ์€ ๋‹ค๋ฅธ ์–ธ์–ด๋“ค์— ๋น„ํ•ด ๋ฌธ๋ฒ•์ด ์–ด๋ ต๊ฒŒ ๋Š๊ปด์ง€์ง€ ์•Š๊ณ , ๊ธฐ์ดˆ๋ฅผ ๋‹ค์งˆ ์ˆ˜ ์žˆ๋Š” ์ž๋ฃŒ๊ฐ€ ๋งŽ์•„ ์ ‘๊ทผ์„ฑ์ด ์‰ฌ์šด ์–ธ์–ด๋ผ๋Š” ์žฅ์ ์ด ์žˆ์ฃ . ์ด๋Ÿฐ ์žฅ์ ๋“ค๋กœ ๋งŽ์€ ๋ถ„๋“ค์ด ํŒŒ์ด์ฌ ๋…ํ•™์— ๋„์ „ํ•˜๋Š”๋ฐ์š”.

์–ธ์–ด์˜ ๊ธฐ๋ณธ ๊ฐœ๋…์„ ์ดํ•ดํ•˜๋Š” ๋ฐ๋Š” ์„ฑ๊ณตํ•ด๋„ ์ด๋ฅผ ์‹ค๋ฌด์— ์ ์šฉํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค๐Ÿฅฒ. ๊ทธ๋ ‡๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ํŒŒ์ด์ฌ ๋…ํ•™ ๊ฒฝํ—˜์„ ๋ฐ”ํƒ•์œผ๋กœ ์‹ค๋ฌด์— ํ•„์š”ํ•œ ๊ธฐ์ˆ ๊ณผ ๊ฒฝํ—˜์„ ์Œ“๊ณ , ์‹ค๋ฌด ๊ฐœ๋ฐœ์ž๋กœ ์ž˜ ์„ฑ์žฅํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”?

๋ชจ๋‘์˜์—ฐ๊ตฌ์†Œ ์†Œ์‹
LAB ์—ฐ๊ตฌ์› ์ฐพ์•„์š”
๐Ÿ”ฅ์ง€๊ธˆ 64๊ฐœ์˜ LAB์ด '์—ฐ๊ตฌ ์ค‘'์ด์—์š”!
ํ’€์žŽ์Šค์ฟจ ์—ฐ๊ตฌ์› ์ฐพ์•„์š”
์—ด๋ฆฐ ์„ธ๋ฏธ๋‚˜
๐Ÿ’ก๋Ÿฐ ํ”„๋กœ์ ํŠธ ์—ญ๊ธฐํš A-Z (1ํšŒ์ฐจ)
??? : "์šฐ๋ฆฌ๋„ ๊ทธ.. ์ฟ *, ์นด์นด* ๊ฐ™์€ ๋ญ ์ข€ ๋งŒ๋“ค์–ด๋ด"
  • ์ผ์‹œ: 6์›” 15์ผ ํ† ์š”์ผ 2PM - 5PM
  • ์žฅ์†Œ: ๋ชจ๋‘์˜์—ฐ๊ตฌ์†Œ ๋Œ€์ „์บ ํผ์Šค
  • ์—ฐ์‚ฌ: ๊น€์„ฑํ™˜ (ํ”„๋ฆฌ๋žœ์„œ)
  • ๋‚ด์šฉ: ์˜ค๋Š˜๋‚  ๊ธฐํš ํŠธ๋ Œ๋“œ ยท ์—ญ๊ธฐํš์ด ํ•„์š”ํ•œ ์ด์œ  ยท STEP 01: ์„œ๋น„์Šค ์„ ์ • ๋ฐ ๊ตฌ์กฐ/๋ชฉํ‘œ ์ „๋žต ์ฐพ๊ธฐ ๋“ฑ
์˜ค๋Š˜๋„ ๋‹˜์˜ ์„ฑ์žฅ์„ ์‘์›ํ• ๊ฒŒ์š”!
์„œ์šธ์‹œ ๊ฐ•๋‚จ๊ตฌ ๊ฐ•๋‚จ๋Œ€๋กœ 324(์—ญ์‚ผ๋””์˜ค์ŠˆํŽ˜๋ฆฌ์›€) 2F