Meta AI / DINOv2 / Image Model 2023๋
9์ 1์ฃผ์ฐจ ์
๋ ํธ์คํ ๋ด์ค๋ ํฐ |
|
|
๊ธ: ๊ถํ์ฃผ ใ
ฃ ๊ฒ์: ์ ์ธ์ |
|
|
๋น์ ํ์ด๋ฐ์ด์
๋ชจ๋ธ '๋๋
ธv2' |
|
|
DINOv2: State-of-the-art computer vision models with self-supervised learning.
์ฌ์ง. Meta AI blog
๋ฉํ๊ฐ ์ต์ ์คํ ์์ค ๋ชจ๋ธ โ๋๋
ธv2(DINOv2)โ์ ์์
์ฉ ๋ผ์ด์ผ์ค(apache 2.0)๋ฅผ ์ ๊ณตํ๋ค๊ณ 31์ผ ๋ฐํ์ต๋๋ค. ๋ฉํ์ ๋ฐ๋ฅด๋ฉด ๋๋
ธv2๋ ๋น์ ํธ๋์คํฌ๋จธ(Vision Transformer) ๊ธฐ๋ฐ ํ์ด๋ฐ์ด์
๋ชจ๋ธ๋ก, ํ์ธ ํ๋ ์์ด๋ ์ด๋ฏธ์ง ๋ถ๋ฅ/๋ถํ /๊ฒ์ ์ฑ๋ฅ์ด ๋งค์ฐ ๋๊ธฐ์ ๋ค์ํ ์ปดํจํฐ ๋น์ ์์
์ ๋ฐฑ๋ณธ์ผ๋ก ์ฌ์ฉํ๊ธฐ์ ์ ํฉํฉ๋๋ค.
*๋ฐฑ๋ณธ(Backbone) ๋ชจ๋ธ์ ๋ฐ์ดํฐ์ ํน์ง์ ์ถ์ถํ๋ ๊ธฐ๋ณธ ๋คํธ์ํฌ ๊ตฌ์กฐ๋ฅผ ์๋ฏธํ๋ฉฐ, ๋ค์ํ ๊ณผ์ ์ํ์ ์ํ ๊ธฐ๋ณธ ๋ชจ๋ธ์ด ๋ฉ๋๋ค(์: VGG, ResNet).
|
|
|
๋ผ๋ฒจ์ด ํ์ ์๋ Self-Supervised Learning ๋น์ ๋ชจ๋ธ |
|
|
์ด๋ฏธ์ง ๋ถํ (Segmentation)๊ณผ ๊น์ด ์ถ์ (Depth estimation) ์์.
์๋ฃ. DINOv2: Learning Robust Visual Features without Supervision.
๋ฉํ๋ DINOv2์ '์๊ธฐ ์ง๋ ํ์ต(SSL, Self-Supervised Learning)'์ด ํ์ฉ๋ ์ ์ ๊ฐ์กฐํ์ต๋๋ค. ์๊ธฐ ์ง๋ ํ์ต์ ์ธ๊ณต ์ง๋ฅ ๋ชจ๋ธ์ด ๋ผ๋ฒจ์ด ์๋ ๋ฐ์ดํฐ์
์ผ๋ก๋ถํฐ ํ์ตํ๋ ๋ฐฉ๋ฒ ์ค ํ๋์
๋๋ค.
์๊ธฐ ์ง๋ ํ์ต์ ์ต๊ทผ ์ปดํจํฐ ๋น์ ๋ชจ๋ธ ํ์ต์ ํ์ค์ผ๋ก ์๋ฆฌ ์ก์ ์ด๋ฏธ์ง-ํ
์คํธ ์ฌ์ ํ๋ จ( Image-text Pretraining, Vision-Language Pretraing)๊ณผ๋ ์ด์ง ๊ฒฐ์ด ๋ค๋ฆ
๋๋ค. ์ผ๋ฐ์ ์ธ ์ด๋ฏธ์ง-ํ
์คํธ ์ฌ์ ํ๋ จ ๊ณผ์ ์์๋ ๋ชจ๋ธ์ด ์ด๋ฏธ์ง์ ๊ทธ ์ฐ๊ด ํ
์คํธ๋ฅผ ์์ผ๋ก ํ์ตํ๊ธฐ ๋๋ฌธ์, ๋ผ๋ฒจ์ด๋ ์ฃผ์์ด ๋ถ์ฌ์ง ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค.
๋ํ์ ์ธ ์ด๋ฏธ์ง-ํ
์คํธ ์ฌ์ ํ๋ จ ๋ชจ๋ธ ์ฌ๋ก๋ก๋ ์คํAI์์ ๋ฐํํ โํด๋ฆฝ(CLIP)โ ๊ณ์ด์ด ์์ต๋๋ค. ํด๋ฆฝ์ ์ฌ์ ํ์ต์ ์บก์
์ด ๋ฌ๋ ค ์๋ ์ด๋ฏธ์ง๋ฅผ ํ์ฉํฉ๋๋ค. ๋ฏธ๋ฆฌ ์ง์ง์ด์ง ์ด๋ฏธ์ง์ ํ
์คํธ๋ฅผ ๊ฐ์ ์ฐจ์(๊ธธ์ด)์ ๋ฒกํฐ๋ก ๋ณํํ๊ณ , ๋ ๋ฒกํฐ์ ์ ์ฌ๋๊ฐ ๋์์ง๋ ๋ฐฉํฅ์ผ๋ก ํ์ตํด ์ธ๊ณต์ง๋ฅ์ด ์ด๋ฏธ์ง์ ๊ทธ ๋ป์ ์ฐ๊ด ์ง์ด ์ดํดํ ์ ์๋๋ก ํฉ๋๋ค.
|
|
|
CLIP: Connecting text and images ์ฌ์ ํ์ต ๊ฐ์.
์๋ฃ. ์คํAI.
ํ์ง๋ง ๋ฉํ์ ๋ฐ๋ฅด๋ฉด, ์ด ๋ฐฉ๋ฒ์ ์ธ๊ณต์ง๋ฅ์ด ์ด๋ฏธ์ง์ ๋ฌ๋ฆฐ ์ค๋ช
(์บก์
)์ ์์กดํ์ฌ ์๋ฏธ๋ฅผ ํ์ตํ๊ธฐ ๋๋ฌธ์ ์๋ฌด๋ฆฌ ์ค์ํ ์ ๋ณด๋ผ๋ ๋ช
์์ ์ผ๋ก ์ ํ์์ง ์๋ค๋ฉด ๋ฌด์ํ ์ํ์ด ์์ต๋๋ค.
์๋ฅผ ๋ค์ด ๋์ ๋ณด๋ผ์ ๋ฐฉ์ ์์๊ฐ ์๋ ์ฌ์ง์ ์บก์
์ด "์๋ชฉ ์์"๋ผ๊ณ ์ ํ ์๋ค๋ฉด, ์ด๋ ๋ฐฐ๊ฒฝ๊ณผ ๊ณต๊ฐ ์ ๋ณด๋ฅผ ์ถฉ๋ถํ ๋ด๊ณ ์์ง ์์ ๋ถ์กฑํ ์ค๋ช
์
๋๋ค. ๋ฐ๋ผ์ ์บก์
๊ธฐ๋ฐ ํ์ต์ ๋์ฑ ์์ธํ ์ ๋ณด๊ฐ ํ์ํ ๋ค์ด์คํธ๋ฆผ ์์
(Downstream task)์์ ์ฑ๋ฅ์ด ์ ํ๋ ์ ์์ต๋๋ค.
์ด์ ๋ฌ๋ฆฌ ์๊ธฐ ์ง๋ ํ์ต์ ํ์ฉํ๋ฉด ์ธ๊ณต์ง๋ฅ์ด ๋ผ๋ฒจ๋ง ์ ๋ณด์ ์์กดํ์ง ์๊ณ , ์ด๋ฏธ์ง์ ๊ณ ์ ํ ์๊ฐ์ ์ ์ฌ์ฑ์ ๋ฐ๋ผ ๋ฐ์ดํฐ์ ์ผ๋ฐ์ ์ธ ํน์ง๊ณผ ํจํด์ ํ์
ํ ์ ์์ต๋๋ค.
๊ฒฐ๊ณผ์ ์ผ๋ก ๋ชจ๋ธ ๊ฐ๋ฐ ๊ณผ์ ์์ ๋ฐ์ดํฐ ๋ผ๋ฒจ๋ง ๋๋ฌธ์ ์๊ธฐ๋ ๋ณ๋ชฉ ํ์์ด ์ค์ด๋ค์ด, ๋ชจ๋ธ ํ๋ จ์ ๋ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์๋ ์๊ณ , ๋ผ๋ฒจ๋ง์ด ์ด๋ ค์ด ํน์ ๋ถ์ผ ๋ฐ์ดํฐ๋ ์ฝ๊ฒ ํ์ตํ ์ ์์ต๋๋ค. ํ์ฌ ๋ฉํ๋ ๋๋
ธ ๋ชจ๋ธ์ ํ์ฉํด ์๋ฃ, ์์ฐ, ํ๊ฒฝ ๋ฑ ๋ค์ํ ๋ถ์ผ์ ์ ๋ฌธ ํ๋ก์ ํธ๊ฐ ์งํ๋๊ณ ์๋ค๊ณ ๋ฐํ์ต๋๋ค.
|
|
|
๋ฐ์ดํฐ ๋ผ๋ฒจ๋ง ๋์ ์ ๋ณ / ๊ฒ์ / ์ฆ๊ฐ |
|
|
DINOv2 ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ์ดํ๋ผ์ธ ๊ฐ์.
์๋ฒ ๋ฉ- ์ค๋ณต ์ ๊ฑฐ-๊ฒ์ ์์ผ๋ก ์ด๋ค์ง๋ค.
์๋ฃ. DINOv2: Learning Robust Visual Features without Supervision.
๊ทธ๋ ๊ธฐ์ ๋๋
ธv2 ์ฌ์ ํ์ต ๊ณผ์ ์์ ๋ฐ์ดํฐ ๋ผ๋ฒจ๋ง ๋์ ๋ฐ์ดํฐ โ์ ๋ณโ ์์
์ด ์ฃผ์ํ์ต๋๋ค. ๋ฉํ ์ธก์ โ์ฐ๋ฆฌ์ ์๊ตฌ ์ฌํญ์ ๋ง๊ฒ ์ ๋ณ๋ ์ถฉ๋ถํ ํฐ ๋ฐ์ดํฐ ์ธํธ๊ฐ ์์๊ธฐ ๋๋ฌธ์ ๊ณต๊ฐ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ ํฌ๋กค๋ง๋ ์น ๋ฐ์ดํฐ ์ ์ฅ์๋ฅผ ํ์ฉํ๋ ๋ฐฉ์์ ์ ํํ๋คโ๊ณ ์ค๋ช
ํ๊ณ ์์ต๋๋ค.
์ด๋ฌํ ์์ค์์ ๋๊ท๋ชจ ์ฌ์ ํ์ต ๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ๋ ค๋ฉด ๋จผ์ ๊ด๋ จ ์๋ ์ด๋ฏธ์ง๋ฅผ ์ญ์ ํ๊ณ , ๋ฐ์ดํฐ์
๋ด์ ๊ท ํ์ ๋ง์ถฐ์ผ ํฉ๋๋ค. ์ด ์ ๋๋ก ์ ๋ฐํ ํ๋ ์ด์
์์
์ ์๋์ผ๋ก ์ํํ๊ธฐ ์ด๋ ต์ต๋๋ค.
๊ทธ๋์ ๋ฉํ๋ ์ฝ 25๊ฐ์ ์ธ๋ถ ๋ฐ์ดํฐ์
์ปฌ๋ ์
์์ ์์ฒ ์ด๋ฏธ์ง๋ฅผ ์ ๋ณํ๊ณ , ์ ๋ณ ์ด๋ฏธ์ง๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ค๋ณต์ ์ ๊ฑฐํ ๋ค์, ์ด์ ์ ์ฌํ ์ด๋ฏธ์ง๋ฅผ ๊ฒ์(retrieval)ํ๊ณ ์ฆ๊ฐ(augment)ํ๋ ๋ฐฉ์์ ์ฌ์ฉํ์ต๋๋ค. ๊ทธ๋ ๊ฒ ์ด 12์ต ๊ฐ์ ์์ค ์ด๋ฏธ์ง ์ค 1์ต 4,200๋ง ๊ฐ์ ์ด๋ฏธ์ง๋ก ๊ตฌ์ฑ๋ ์ฌ์ ํ์ต ๋ฐ์ดํฐ ์ธํธ๊ฐ ์์ฑ๋์ต๋๋ค.
โThis was achieved by curating a set of seed images from a collection of about 25 third-party datasets and extending it by retrieving images sufficiently close to those seed imagesโ
|
|
|
์ฌ๋ค์ด ๋ฉํ๋ ๋ผ๋ง(Llama), ์(SAM), ๋๋
ธ(DINOv2) ๋ฑ ๋ง์ ๋ชจ๋ธ์ ์คํ ์์ค๋ก ๊ณต๊ฐํ๊ณ ์์ต๋๋ค. ๋ค์ํ ์ฌ๋๋ค์ด ๋ชจ๋ธ์ ํ์ฉํ๋ ๊ณผ์ ์์ ๊ฐ๋ฐ์ ์ปค๋ฎค๋ํฐ๊ฐ ํ์ฑ๋๊ณ , ๊ธฐ์ ํ์ ์ด ๋นจ๋ผ์ง๊ณ , ์ฌํ์ ์ํฅ๋ ฅ์ด ํ๋๋๋ ํจ๊ณผ๊ฐ ์์ต๋๋ค.
์ผ๋ก๋ก ์
๋ ํธ์คํ ๋ํ ๋ฉํ์ ์(SAM, Segment Anything Model)์ ๋ฐ์ดํฐ ๊ฐ๊ณต ํ๋ก๋ํธ์ ์ ๋ชฉํด ํจ๊ณผ์ ์ธ ๋ฐ์๋ ๋ผ๋ฒจ๋ง์ ์ง์ํ๊ณ ์์ต๋๋ค :) ์์ผ๋ก ๋ฉํ๊ฐ ๊ณต๊ฐํ ๋ ๋๋๊ณ ๋ฐ์ด๋ ๊ธฐ์ ๋ค์ด ๊ธฐ๋๋๋ค์!
์ฐธ๊ณ ์๋ฃ:
|
|
|
AI ๋คํธ์ํน ํ์ฌ ์๋ด ๋ฐ ์ฐธ์ฌ ๊ธฐ์
๋ชจ์ง |
|
|
#1. 9์ AI ๋
ธ๋ค์ง ๋คํธ์ํน ํํฐ ์ด์ฒญ
๋ด์ผ (9์ 7์ผ), ์
๋ ํธ์คํ์ ์์ธ๊ฒฝ์ ์งํฅ์(SBA)์ด ํจ๊ปํ๋ AI ์คํ๋ผ์ธ ๋คํธ์ํน ํํฐ์ ์ด๋ํฉ๋๋ค.
9์ ์ฃผ์ ๋ <์๋์ฐจ ์ฐ์
๊ณผ ์ธ๊ณต์ง๋ฅ์ ์ตํฉ>์ผ๋ก, ์ด์ฒญ์ฐ์ฌ๋ SOCAR ๋ฐ์ดํฐ ๋น์ฆ๋์ค๋ณธ๋ถ ๊ธฐ์ ๊ธฐํํ ์ฃผ์ํ ๋, ๋ฐ์ธ์ค ๋์
๋๋ค. *๋ณธ ํ์ฌ๋ ๋ฌด๋ฃ๋ก ์งํ๋๋ฉฐ, ์ฐธ๊ฐ ์ ์ฒญ์ด ์ด๋ฅด๊ฒ ๋ง๊ฐ๋ ์ ์์ต๋๋ค. |
|
|
#2. AI ํ์ต๋ฐ์ดํฐ ๊ตฌ์ถ ์ฌ์
์ง์
์
๋ ํธ์คํ๊ฐ ๋ฐ์ดํฐ ๊ตฌ์ถ ์ธํ๋ผ๋ฅผ ์ ๊ณตํฉ๋๋ค. ํฌ๋ผ์ฐ๋ ์์ฑ ์์
์ ๊ตฌ์ธ-๊ด๋ฆฌ๋ถํฐ ๋ฐ์๋ ๋ผ๋ฒจ๋ง ์๋ฃจ์
๊น์ง.
๋ฐ์ดํฐ์
๊ตฌ์ถ ์ง์ ์ฌ์
์ ์
๋ ํธ์คํ์ ํจ๊ปํ์ธ์.
|
|
|
The Data for Smarter AI
์ธ์ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ์ฐพ์, ์
๋ ํธ์คํ๋
AI ๋ผ์ดํ์ฌ์ดํด์ ํจ๊ปํ๋ ์ฌ์ธ์ ๋ฐ์ดํฐ ํ๋ซํผ์
๋๋ค.
|
|
|
๐ ์ฌ์
๋ฐ ์ ํด ๋ฌธ์ contact@selectstar.ai
๐จ ์ฝํ
์ธ ๋ฐ ํ์ฌ ๋ฌธ์ marketing@selectstar.ai
|
|
|
|
|