#Llama2๐Ÿฆ™ #PolyLM
ํ•จ๊ป˜ ๊ณต์œ ํ•˜๊ณ  ์„ฑ์žฅํ•˜๋Š” ์—ฐ๊ตฌ ๋ฌธํ™”๋ฅผ ์ „ํŒŒํ•ด์š”
2023๋…„ 7์›” 24์ผ ๋ชจ๋‘๋ ˆํ„ฐ
๋‹˜, ๋ชจ๋‘๋ ˆํ„ฐ๊ฐ€ ์™”์–ด์š”.
์š”์ฆ˜ ์—ฌ๋Ÿฌ ์•ˆํƒ€๊นŒ์šด ์ผ๋“ค๋กœ ์†์ƒํ•˜์ฃ ๐Ÿ˜ข
๋”ฐ๋œปํ•œ ํ•œ๋งˆ๋””, ์†Œ์†Œํ•œ ๋ฐฐ๋ ค๊ฐ€ ์„ธ์ƒ์— ๋”์šฑ ํ•„์š”ํ•œ ๊ฒƒ ๊ฐ™์•„์š”.
'๋‚ด๊ฐ€ ๊ทธ ์‚ฌ๋žŒ ์ž…์žฅ์ด๋ฉด ๋งˆ์Œ์ด ์–ด๋–จ๊นŒ.'
์ด๋Ÿฐ ์ž‘์€ ์ƒ๊ฐ์ด ์„ธ์ƒ์„ ๋ฐ”๊พธ๋Š” ๊ฒŒ ์•„๋‹๊นŒ์š”?
์ด๋ฒˆ์ฃผ AI ์†Œ์‹
  • ๋ฉ”ํƒ€, Llama 2 ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ณต๊ฐœ
  • PolyLM: ๋‹ค๊ตญ์–ด ์ง€์›ํ•˜๋Š” ์˜คํ”ˆ ์†Œ์Šค ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ
  • ์ธํ…” CPU๋กœ Stable Diffusion ๋ชจ๋ธ ํŒŒ์ธ ํŠœ๋‹ํ•˜๊ธฐ
์—ด๋ฆฐ ์„ธ๋ฏธ๋‚˜: ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด์—์„œ ๋ถ€์ŠคํŒ…๊นŒ์ง€ ๋ณ€์ฒœ์‚ฌ ์‚ดํŽด๋ณด๊ธฐ
๋ฉ”ํƒ€, Llama 2 ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ณต๊ฐœ
ยฉMeta AI. ๋ฉ”ํƒ€๋Š” '๋ผ๋งˆ2'๋ฅผ ์™œ ์˜คํ”ˆ์†Œ์Šค๋กœ ๊ณต๊ฐœํ–ˆ์„๊นŒ์š”?
๋ฉ”ํƒ€(Meta)๊ฐ€ ์ž์‚ฌ์˜ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ '๋ผ๋งˆ2(Llama 2)'๋ฅผ ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ณต๊ฐœํ–ˆ๋Š”๋ฐ์š”. ์ƒ์—…์ ์œผ๋กœ๋„ ์—ฐ๊ตฌ์šฉ์œผ๋กœ๋„ ๋ฌด๋ฃŒ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๋ผ๋งˆ2๋Š” ๊ธฐ์กด ๋ผ๋งˆ๋ณด๋‹ค 40% ๋” ๋งŽ์€ 2์กฐ ๊ฐœ์˜ ํ† ํฐ(๋ง๋ญ‰์น˜ ๋ฐ์ดํ„ฐ)์œผ๋กœ ํ•™์Šต๋์œผ๋ฉฐ, ์ปจํ…์ŠคํŠธ ๊ธธ์ด*๋„ ๋‘ ๋ฐฐ ์ฆ๊ฐ€ํ•œ 4096์œผ๋กœ ์„ค์ •๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ผ๋งˆ2๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ˆ˜์— ๋”ฐ๋ผ '๋ผ๋งˆ-2-7B, 13B, 70B'์˜ ์„ธ ๊ฐ€์ง€ ๋ชจ๋ธ์ด ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. ์ถ”๋ก , ์ฝ”๋”ฉ, ์ง€์‹ ํ…Œ์ŠคํŠธ ๋“ฑ ๋‹ค์–‘ํ•œ ํƒœ์Šคํฌ๋ฅผ ํฌํ•จํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ ํ…Œ์ŠคํŠธ์—์„œ ๋ผ๋งˆ2๋Š” MPT, Falcon ๋“ฑ์˜ ๋‹ค๋ฅธ ์˜คํ”ˆ์†Œ์Šค LLM๋ณด๋‹ค ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚ฌ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ—ˆ๊น…ํŽ˜์ด์Šค์˜ ์˜คํ”ˆ์†Œ์Šค LLM ๋ฆฌ๋”๋ณด๋“œ์—์„œ๋„ 70B ๋ชจ๋ธ์€ 1์œ„๋ฅผ ๊ธฐ๋ก, 7B์™€ 13B ๋ชจ๋ธ์€ ๋น„์Šทํ•œ ํฌ๊ธฐ์˜ ๋‹ค๋ฅธ ์ƒ์œ„๊ถŒ ๋ชจ๋ธ๊ณผ ๋น„์Šทํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๋ผ๋งˆ2๋Š” ํ˜„์žฌ ํ™ˆํŽ˜์ด์ง€์—์„œ ์‹ ์ฒญํ•˜๋ฉด ๋‹ค์šด๋ฐ›์„ ์ˆ˜ ์žˆ๊ณ , ๋งˆ์ดํฌ๋กœ์†Œํ”„ํŠธ ์• ์ €(Microsoft Azure)์—์„œ๋„ ์‚ฌ์šฉํ•ด ๋ณผ ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•˜๋„ค์š”!
*์ปจํ…์ŠคํŠธ ๊ธธ์ด(Context length): ํ•˜๋‚˜์˜ ์–ธ์–ด ๋ชจ๋ธ์ด ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ํ† ํฐ์˜ ์–‘์œผ๋กœ, ๊ธธ์ด๊ฐ€ ๊ธธ์ˆ˜๋ก ๋” ๋งŽ์€ ์ •๋ณด์™€ ๋” ๋‹ค์–‘ํ•œ ๋งฅ๋ฝ์„ ์ดํ•ดํ•  ์ˆ˜ ์žˆ์–ด์š”.
PolyLM: ๋‹ค๊ตญ์–ด ์ง€์›ํ•˜๋Š” ์˜คํ”ˆ ์†Œ์Šค ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ

์˜คํ”ˆAI์˜ ์ฑ—GPT๋‚˜ ๊ตฌ๊ธ€ ๋ฐ”๋“œ(Bard)๋Š” ํ•œ๊ตญ์–ด๋กœ๋„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์ฃ . ํ•˜์ง€๋งŒ ๋Œ€๋ถ€๋ถ„์˜ LLM(Large Language Model)์€ ์˜์–ด๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ๊ฐœ๋ฐœ๋˜์–ด ์™”์–ด์š”. ์‚ฌ์‹ค ์ผ๋ถ€ ์–ธ์–ด๋ฅผ ์ œ์™ธํ•˜๋ฉด ์–ธ์–ด ๋ชจ๋ธ ๊ตฌ์ถ•์— ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ๊ฐ€ ํฌ์ง€ ์•Š์€๋ฐ์š”. ์˜ˆ๋ฅผ ๋“ค๋ฉด, ํƒœ๊ตญ์–ด์™€ ์ธ๋„๋„ค์‹œ์•„์–ด์˜ ํ™”์ž๋Š” 3์–ต ๋ช…์ด ๋„˜์ง€๋งŒ ์ด๋“ค ์–ธ์–ด๋กœ ์ด๋ค„์ง„ ๋ฐ์ดํ„ฐ์…‹์€ ํ† ํฐ ์ˆ˜๊ฐ€ ์˜์–ด์˜ 3% ๋ฐ–์— ๋˜์ง€ ์•Š๋Š”๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์•Œ๋ฆฌ๋ฐ”๋ฐ” ๊ทธ๋ฃน์˜ DAMO ์•„์นด๋ฐ๋ฏธ์—์„œ ๋ฐœํ‘œํ•œ 'PolyLM'์€ ๋‹ค๊ตญ์–ด ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ•™์Šต๋œ ์˜คํ”ˆ์†Œ์Šค ์–ธ์–ด ๋ชจ๋ธ์ธ๋ฐ์š”. 18๊ฐœ ์–ธ์–ด๋กœ ๋œ ์›น ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹์„ ๋ชจ์•„ ๋ชจ๋ธ์„ ํ•™์Šต์‹œ์ผฐ๊ณ , ๋ฐ์ดํ„ฐ์…‹์˜ ์ „์ฒด ํฌ๊ธฐ๋Š” ์•ฝ 6,400์–ต(640B) ๊ฐœ์ž…๋‹ˆ๋‹ค. ๋‹ค์–‘ํ•œ ์–ธ์–ด๋ฅผ ์ดํ•ดํ•˜๋Š” ํƒœ์Šคํฌ์—์„œ 'LLaMA 1', 'BLOOM' ๋“ฑ ๋‹ค๋ฅธ ์˜คํ”ˆ์†Œ์Šค LLM๋ณด๋‹ค ์„ฑ๋Šฅ์ด ์ข‹์•˜๋‹ค๊ณ  ํ•˜๋„ค์š”. AI์™€ ๋‹ค์–‘์„ฑใƒปํฌ์šฉ์„ฑ ๊ด€๋ จ ์ฃผ์ œ๊ฐ€ ๊ณ„์† ๋– ์˜ค๋ฅด๋Š” ๋งŒํผ ๋‹ค๊ตญ์–ด ์–ธ์–ด ๋ชจ๋ธ ์—ฐ๊ตฌ๋„ ํ™œ๋ฐœํžˆ ์ง„ํ–‰๋˜๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์ธํ…” CPU๋กœ Stable Diffusion ๋ชจ๋ธ ํŒŒ์ธ ํŠœ๋‹ํ•˜๊ธฐ

ํ—ˆ๊น…ํŽ˜์ด์Šค ๋ธ”๋กœ๊ทธ์— CPU๋กœ ์Šคํ…Œ์ด๋ธ” ๋””ํ“จ์ „(Stable Diffusion) ๋ชจ๋ธ์„ ํŒŒ์ธ ํŠœ๋‹(Fine-tuning)ํ•˜๋Š” ๊ณผ์ •์ด ๋‹ด๊ธด ๊ธ€์ด ์˜ฌ๋ผ์™”์–ด์š”. ๊ทธ๋ƒฅ CPU๋Š” ์•„๋‹ˆ๊ตฌ์š”, 'Sapphire Rapids'๋ผ๊ณ  ๋ถˆ๋ฆฌ๋Š” ์ธํ…” 4์„ธ๋Œ€ ์ œ์˜จ(Xeon) ํ”„๋กœ์„ธ์„œ์ธ๋ฐ์š”. ๋ณธ๋ฌธ์—์„œ ์‚ฌ์šฉ๋œ CPU๋Š” 1๋งŒ ๋‹ฌ๋Ÿฌ๊ฐ€ ๋„˜๋Š” ๊ณ ๊ฐ€์˜ ๋ชจ๋ธ์ด์ง€๋งŒ, ์•„๋งˆ์กด์˜ AWS๋‚˜ ๊ตฌ๊ธ€์˜ GCP์™€ ๊ฐ™์€ ํด๋ผ์šฐ๋“œ ์„œ๋น„์Šค๋ฅผ ์ด์šฉํ•  ๊ฒฝ์šฐ GPU ์„œ๋ฒ„๋ฅผ ๋Œ€์—ฌํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ์ €๋ ดํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•ด์š”. ๋˜ํ•œ, ๋”ฅ๋Ÿฌ๋‹ ํ•™์Šต์— ํŠนํ™”๋œ GPU์™€ ๋‹ฌ๋ฆฌ CPU๋Š” ์ปดํ“จํ„ฐ์˜ ์ „๋ฐ˜์ ์ธ ์ž‘์—…์— ๋ชจ๋‘ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์–ด์„œ ์„œ๋ฒ„ ์ธํ”„๋ผ๋ฅผ ๊ตฌ์„ฑํ•  ๋•Œ ๋” ์œ ์—ฐํ•œ ์„ ํƒ์ด ๋  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•˜๋„ค์š”.

CPU๋ฅผ ํšจ์œจ์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด ๋ณธ๋ฌธ์—์„œ๋Š” ์ธํ…” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ธ 'oneCCL', 'IPEX'์™€ ํ•จ๊ป˜ ๋ฉ”๋ชจ๋ฆฌ ํ• ๋‹น ๋“ฑ์˜ ์šด์˜์ฒด์ œ ์ž‘์—…์„ ์ตœ์ ํ™”ํ•˜๋Š” ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋“ค์„ ์„ค์น˜ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ ์€ ์ˆ˜์˜ ์ด๋ฏธ์ง€๋กœ๋„ ์Šคํ…Œ์ด๋ธ” ๋””ํ“จ์ „ ๋ชจ๋ธ ํ•™์Šต์„ ์ง„ํ–‰ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” 'textual inversion'์ด๋ผ๋Š” ๊ธฐ๋ฒ•๊ณผ, ํ—ˆ๊น…ํŽ˜์ด์Šค 'Diffusers' ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ–ˆ๋‹ค๊ณ  ํ•ด์š”. 1์‹œ๊ฐ„ ์ •๋„์˜ ํ•™์Šต์œผ๋กœ ๊ฝค ๊ดœ์ฐฎ์€ ์ด๋ฏธ์ง€๊ฐ€ ์ƒ์„ฑ๋๋‹ค๊ณ  ํ•˜๋Š”๋ฐ, ํ•œ ๋ฒˆ ํ™•์ธํ•ด ๋ณด์„ธ์š”!

๋ชจ๋‘์—ฐ ์ปค๋ฎค๋‹ˆํ‹ฐ ์†Œ์‹
LAB ์—ฐ๊ตฌ์› ์ฐพ์•„์š”
  • Fundamental LM(FunLM) LAB _7์›” 25์ผ๊นŒ์ง€ #์‹œ์ฆŒ2
ํ’€์žŽ์Šค์ฟจ ์—ฐ๊ตฌ์› ์ฐพ์•„์š” _โณ์„ ์ฐฉ์ˆœ ๋งˆ๊ฐ
๐Ÿก๊ณต์ง€์‚ฌํ•ญ
๋‹ค์Œ์ฃผ 7์›” 31์ผ(์›”) - 8์›” 6์ผ(์ผ) ์ฃผ๊ฐ„์€ ๋ชจ๋‘์˜์—ฐ๊ตฌ์†Œ์˜ ์—ฌ๋ฆ„๋ฐฉํ•™์ด์—์š”๐Ÿ๏ธ. ๋ฐฉํ•™ ๋™์•ˆ ๊ฐ•๋‚จ์บ ํผ์Šค์™€ ์—ญ์‚ผ์บ ํผ์Šค ๊ณต๊ฐ„๋„ ๋ฌธ์„ ๋‹ซ์œผ๋‹ˆ ์ด์šฉ์— ์ฐธ๊ณ ํ•ด ์ฃผ์„ธ์š”. ์ž ์‹œ ์‰ฌ์—ˆ๋‹ค๊ฐ€, 8์›” 7์ผ๋ถ€ํ„ฐ ๋‹ค์‹œ ๋งŒ๋‚˜์š”! :)
์—ด๋ฆฐ ์„ธ๋ฏธ๋‚˜
์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด์—์„œ ๋ถ€์ŠคํŒ…๊นŒ์ง€ ๋ณ€์ฒœ์‚ฌ ์‚ดํŽด๋ณด๊ธฐ
  • ์ผ์‹œ: 7์›” 25์ผ ํ™”์š”์ผ I 7:30PM - 9:00PM
  • ์žฅ์†Œ: ๋ชจ๋‘์˜์—ฐ๊ตฌ์†Œ ๊ฐ•๋‚จ์บ ํผ์Šค
  • ์—ฐ์‚ฌ:๋ฐ•์กฐ์€(์˜ค๋Š˜์ฝ”๋“œ)
  • ๋‚ด์šฉ: ์ •ํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ ML์—์„œ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ๋ถ€์ŠคํŒ… ๋ชจ๋ธ๊นŒ์ง€์˜ ๋ณ€์ฒœ์‚ฌ I Q&A ๋“ฑ
์˜ค๋Š˜๋„ ๋‹˜์˜ ์„ฑ์žฅ์„ ์‘์›ํ• ๊ฒŒ์š”!๐Ÿค—
์•—, ๋ ˆํ„ฐ๊ฐ€ ๋ฉ”์ผํ•จ์—์„œ ์•ˆ ๋ณด์ด๋‚˜์š”?
  • ์ŠคํŒธ๋ฉ”์ผํ•จ์—์„œ ์šธ๊ณ  ์žˆ์„์ง€๋„ ๋ชฐ๋ผ์š”. ์ฐพ์•„๊ฐ€ ํ™•์ธํ•ด ๋ณด์„ธ์š”!
  • ์ฃผ์†Œ๋ก์— ๋ชจ๋‘์˜์—ฐ๊ตฌ์†Œ ์ด๋ฉ”์ผ ์ฃผ์†Œ(modulabs01@gmail.com)๋ฅผ ์ถ”๊ฐ€ํ•ด ์ฃผ์„ธ์š”.
(์ฃผ)๋ชจ๋‘์˜์—ฐ๊ตฌ์†Œ
์„œ์šธ์‹œ ๊ฐ•๋‚จ๊ตฌ ๊ฐ•๋‚จ๋Œ€๋กœ 324(์—ญ์‚ผ๋””์˜ค์ŠˆํŽ˜๋ฆฌ์›€) 2F