πŸ’« λ†“μΉ˜λ©΄ μ•ˆλ˜λŠ” 이번주 AI μ†Œμ‹ TOP 3
2024λ…„ 8μ›” 1μ£Όμ°¨ μ…€λ ‰νŠΈμŠ€νƒ€ λ‰΄μŠ€λ ˆν„°
κΈ€: 이성배, λ”₯λ‹€μ΄λΈŒ(deep daiv.) 제휴 μ½˜ν…μΈ  γ…£ 에디터: μ •μΈμ˜                                            
πŸ“° μ£Όλ¬Έν•˜μ‹  SAM2 λ‚˜μ™”μŠ΅λ‹ˆλ‹€

μ§€λ‚œλ‹¬ 29일, Metaκ°€ SAM(Segment Anything Model) 2λ₯Ό κ³΅κ°œν–ˆμŠ΅λ‹ˆλ‹€. 2023λ…„ 4μ›”, SAM을 처음 선보인 λ’€λ‘œ 1λ…„ 4κ°œμ›”λ§ŒμΈλ°μš”. μ–Όλ§ˆλ‚˜ λ‹¬λΌμ‘ŒλŠ”μ§€ μ‚΄νŽ΄λ³ΌκΉŒμš”? 🧐

Segmentation의 기반 λͺ¨λΈ, SAM

SAM은 κ·Έ μ΄λ¦„μ²˜λŸΌ μ–΄λ–€ 것이든 λΆ„ν• (Segment Anything)을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€. μ—¬κΈ°μ„œ λΆ„ν• (Segmentation)μ΄λž€, λ°°κ²½κ³Ό λ‹€λ₯Έ 사물을 ꡬ뢄해 νŠΉμ •ν•œ 객체의 μ˜μ—­μ„ μ°Ύμ•„λ‚΄λŠ” κ²ƒμž…λ‹ˆλ‹€. 화상 νšŒμ˜μ—μ„œ λ‚΄ 배경을 μ œκ±°ν•˜λŠ” κΈ°λŠ₯을 λ– μ˜¬λ¦¬λ©΄ μ‰½κ²Œ 이해할 수 μžˆμŠ΅λ‹ˆλ‹€.


이λ₯Ό μœ„ν•΄μ„œλŠ” 객체 λ‹¨μœ„λ₯Ό λ‚˜λˆ„λŠ” 기쀀이 λͺ…ν™•ν•΄μ•Ό ν•©λ‹ˆλ‹€. λ˜ν•œ 기쀀에 따라 Segmentation νƒœμŠ€ν¬λ₯Ό λ”μš± μ„ΈλΆ€μ μœΌλ‘œ κ΅¬λΆ„ν•˜λŠ”λ°μš”. μ•„λž˜ 이미지와 같이 의미 λ‹¨μœ„(e.g. μ‚¬λžŒλ“€ 전체)둜 λΆ„ν• ν•˜κΈ°λ„ ν•˜κ³ , μΈμŠ€ν„΄μŠ€ λ‹¨μœ„(e.g. ν•œ μ‚¬λžŒμ”©)으둜 κ΅¬λΆ„ν•˜λŠ” λ“± λͺ©ν‘œμ— 따라 λΆ„ν•  방법이 λ‹¬λΌμ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€.

좜처: Towards Data Science <Single Stage Instance Segmentation β€” A Review>


λ™μΌν•œ 이미지도 λ•Œμ— 따라 λΆ„ν• μ˜ λͺ©μ μ΄ λ‹€λ₯Ό 수 μžˆμŠ΅λ‹ˆλ‹€. μ‚¬μš©μžμ˜ μ •ν™•ν•œ μ˜λ„λ₯Ό νŒŒμ•…ν•˜κΈ° μœ„ν•΄μ„œλŠ” μΌμ’…μ˜ ν”„λ‘¬ν”„νŠΈ(Prompt)κ°€ ν•„μš”ν•œλ°μš”. 이미지 λͺ¨λΈμ€ μ–Έμ–΄ λͺ¨λΈλ³΄λ‹€ λ‹€μ–‘ν•œ ν”„λ‘¬ν”„νŠΈλ₯Ό μž…λ ₯으둜 받을 수 μžˆμŠ΅λ‹ˆλ‹€. μ‹œκ°μ  ν”„λ‘¬ν”„νŠΈμ˜ μ˜ˆλ‘œλŠ” νŠΉμ •ν•œ 객체의 ν¬μΈνŠΈλΌλ“ κ°€, μ›ν•˜λŠ” μ˜μ—­μ— λ§ˆμŠ€ν‚Ήν•œ κ²°κ³Όκ°€ μžˆμŠ΅λ‹ˆλ‹€. 

λ‹€μ–‘ν•œ Segmentation Prompt μ˜ˆμ‹œ. 좜처: <Segment Anything> (Kirillov et al., 2023)


λΆ„ν•  νƒœμŠ€ν¬μ˜ μ–΄λ €μš΄ 점은 λ°”λ‘œ λͺ¨ν˜Έμ„±(Ambiguity)에 μžˆμŠ΅λ‹ˆλ‹€. 아무리 ν”„λ‘¬ν”„νŠΈλ₯Ό μž…λ ₯ λ°›λŠ”λ‹€κ³  ν•˜λ”λΌλ„, ν•˜λ‚˜μ˜ 점 λ˜λŠ” 마슀크 μ˜μ—­λ§ŒμœΌλ‘œλŠ” μ •ν™•νžˆ 무엇을 μ›ν•˜λŠ”μ§€ μ•ŒκΈ° μ–΄λ €μšΈ 수 있기 λ•Œλ¬ΈμΈλ°μš”. 예λ₯Ό λ“€μ–΄, μ‚¬λžŒ 이미지에 μ˜·μ„ ν΄λ¦­ν–ˆλ‹€λ©΄ μ‚¬λžŒμ„ μ„ νƒν•œ 것인지, μ•„λ‹ˆλ©΄ 옷 자체λ₯Ό μ„ νƒν•œ 것인지 νŒŒμ•…μ΄ μ–΄λ €μšΈ 수 μžˆμŠ΅λ‹ˆλ‹€. SAM은 이런 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄μ„œ ν•˜λ‚˜μ˜ μž…λ ₯값에 λŒ€ν•΄μ„œ κ·Έ μž…λ ₯을 ν¬ν•¨ν•˜λŠ” μ—¬λŸ¬ λŒ€μƒ(전체(Whole), λΆ€λΆ„(Part), λΆ€λΆ„ λ‚΄ μ˜μ—­(Subpart))을 μ˜ˆμΈ‘ν•˜λ„λ‘ κ°œλ°œν–ˆλ‹€λŠ” νŠΉμ§•μ΄ μžˆμŠ΅λ‹ˆλ‹€.

전체(Whole) , λΆ€λΆ„(Part) , λΆ€λΆ„ λ‚΄ μ˜μ—­(Subpart)을 μ˜ˆμΈ‘ν•΄ κ²°κ³Όλ₯Ό μ œμ‹œν•˜λŠ” SAM.
좜처: <Segment Anything> (Kirillov et al., 2023)

SAM 2, 무엇이 λ‹¬λΌμ‘Œμ„κΉŒ?

SAM 2λŠ” μ–΄λ–€ 점이 λ‹¬λΌμ‘Œμ„κΉŒμš”? 이번 SAM 2λ₯Ό 닀룬 λ…Όλ¬Έμ˜ 제λͺ©μ„ μ‚΄νŽ΄λ³΄λ©΄ κ·Έ 닡을 μ•Œ 수 μžˆμŠ΅λ‹ˆλ‹€. <SAM 2: Segment Anything in Images and Videos>. 이제 λΉ„λ””μ˜€μ—μ„œλ„ 뢄할이 κ°€λŠ₯ν•΄μ‘ŒμŠ΅λ‹ˆλ‹€.


λΉ„λ””μ˜€λŠ” λ‹¨μˆœνžˆ μ΄λ―Έμ§€μ˜ ν•©μœΌλ‘œ 보긴 μ–΄λ ΅μŠ΅λ‹ˆλ‹€. λΉ„λ””μ˜€λŠ” 이미지와 달리 β€˜μ‹œκ°„β€™μ΄λΌλŠ” μƒˆλ‘œμš΄ 좕이 ν•„μš”ν•©λ‹ˆλ‹€. 그리고 λ™μΌν•œ λŒ€μƒμ— λŒ€ν•΄μ„œ β€˜μ‹œκ°„β€™μ΄ 흐λ₯΄λ”라도 μΌκ΄€λ˜κ²Œ 객체λ₯Ό λΆ„ν• ν•΄μ•Ό ν•˜κΈ° λ•Œλ¬Έμ— 훨씬 λ‚œλ„ 높은 κ³Όμ œμ΄μ§€μš”. λ¨Όμ € SAM 2의 전체적인 ꡬ쑰λ₯Ό μ‚΄νŽ΄λ³΄κ² μŠ΅λ‹ˆλ‹€.

μ˜μƒ 데이터에 λŒ€ν•΄μ„œ λ°•μŠ€, 포인트, 마슀크 λ“±μ˜ 정보가 ν”„λ‘¬ν”„νŠΈλ‘œ μž…λ ₯λ©λ‹ˆλ‹€. 그리고 이미지 인코더와 ν”„λ‘¬ν”„νŠΈ μΈμ½”λ”λ‘œ κ΅¬μ„±λœ λͺ¨λΈμ— 이 정보 ν”„λ‘¬ν”„νŠΈλ₯Ό μž…λ ₯ν•˜κ³ , λ§ˆμŠ€ν‚Ή μ˜μ—­μ„ λ””μ½”λ”©ν•˜λŠ” μ‹μž…λ‹ˆλ‹€.


이번 λͺ¨λΈμ—μ„œ λ³€κ²½λœ λΆ€λΆ„ μ—­μ‹œ 이 λΉ„λ””μ˜€μ—μ„œ 마슀크λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” 데 νŠΉν™”λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. λͺ¨λΈ 이미지λ₯Ό μ‚΄νŽ΄λ³΄λ©΄ Memory Attention, Memory Bankκ°€ λˆˆμ— λ„λŠ”λ°μš”. Memory Attention은 ν˜„μž¬ ν”„λ ˆμž„μ˜ νŠΉμ§•μ„ 이전 ν”„λ ˆμž„μ˜ νŠΉμ§• 및 μ˜ˆμΈ‘κ°’κ³Ό κ²°ν•©ν•˜κ³ , Memory BankλŠ” λΉ„λ””μ˜€μ—μ„œ 타깃 객체의 κ³Όκ±° 예츑 정보λ₯Ό μ €μž₯ν•˜λŠ” 역할을 ν•©λ‹ˆλ‹€. μ•žμ„œ λ§μ”€λ“œλ¦° κ²ƒμ²˜λŸΌ λΉ„λ””μ˜€μ—μ„œ μ‹œκ°„μ— λ”°λ₯Έ 일관성은 μ€‘μš”ν•©λ‹ˆλ‹€. 이λ₯Ό μœ μ§€ν•˜κΈ° μœ„ν•΄μ„œ 연ꡬ진은 λ‹€μŒ ν”„λ ˆμž„μ˜ 마슀크λ₯Ό μ˜ˆμΈ‘ν•  λ•Œ, 이전 ν”„λ ˆμž„μ˜ 정보λ₯Ό 같이 μ£Όμž…ν•˜λ„λ‘ λͺ¨λΈ ꡬ쑰λ₯Ό μ„€κ³„ν–ˆμŠ΅λ‹ˆλ‹€.

SAM 2λ₯Ό κ°€λŠ₯ν•˜κ²Œ λ§Œλ“  데이터 μ—”μ§„

642.6K의 Masklets(μ˜μƒ 속 λ°•μŠ€, 포인트 λ“±μ˜ ν”„λ‘¬ν”„νŠΈ 정보)와 35.5M개의 마슀크, 50.9K개의 λΉ„λ””μ˜€λ‘œ κ΅¬μ„±λœ λŒ€λŸ‰μ˜ 데이터셋을 κ΅¬μΆ•ν•˜κΈ° μœ„ν•΄ MetaλŠ” 자체적인 데이터 엔진을 ν™œμš©ν–ˆμŠ΅λ‹ˆλ‹€. SAM 2의 데이터 엔진은 총 3λ‹¨κ³„λ‘œ κ΅¬λΆ„λ©λ‹ˆλ‹€.


1. 첫 번째 λ‹¨κ³„λŠ” SAM을 κ°œλ°œν•˜λ©΄μ„œ μ œμ•ˆν•œ 데이터 μ—”μ§„μ˜ 도움을 λ°›μ•„μ„œ 인간 μž‘μ—…μžκ°€ 직접 λ ˆμ΄λΈ”λ§ν•˜λŠ” κ³Όμ •μž…λ‹ˆλ‹€. μ‹œκ°„κ³Ό λΉ„μš©μ΄ 많이 λ“€μ§€λ§Œ μ–‘μ§ˆμ˜ 데이터λ₯Ό 확보할 수 μžˆμŠ΅λ‹ˆλ‹€.


2. λ‹€μŒ λ‹¨κ³„μ—μ„œλŠ” SAM 2λ₯Ό μΆ”κ°€ν•˜μ—¬ SAM 2 Mask 버전을 μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€. μ—¬κΈ°μ„œλŠ” λ§ˆμŠ€ν¬λ§Œμ„ ν”„λ‘¬ν”„νŠΈλ‘œ μ‚¬μš©ν•˜λŠ”λ°μš”. μž‘μ—…μžλŠ” 1λ‹¨κ³„μ—μ„œμ²˜λŸΌ SAM을 μ‚¬μš©ν•΄ 마슀크λ₯Ό κ·Έλ¦° ν›„ SAM 2 Maskλ₯Ό 톡해 마슀크λ₯Ό μ˜μƒ 속 λ‹€λ₯Έ ν”„λ ˆμž„μœΌλ‘œ μ „λ‹¬ν•©λ‹ˆλ‹€. μ˜μƒ 속 μ‹œκ°„ 좕에 λ”°λΌμ„œ λΉ„μŠ·ν•œ κ²°κ³Όλ₯Ό 생성해야 ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. 이후 ν”„λ ˆμž„μ—μ„œλŠ” SAMκ³Ό β€˜λΈŒλŸ¬μ‹œ 및 β€˜μ§€μš°κ°œβ€™ 도ꡬλ₯Ό μ‚¬μš©ν•΄ 마슀크λ₯Ό μˆ˜μ •ν•˜κ³ , 이λ₯Ό SAM 2 Mask에 ν”Όλ“œλ°±ν•˜μ—¬ 더 μ •ν™•ν•œ 마슀크λ₯Ό λ§Œλ“­λ‹ˆλ‹€. μΌμ’…μ˜ SAM 2의 데이터 생성 및 ν•™μŠ΅ 루프λ₯Ό κ°œλ°œν•œ κ²ƒμž…λ‹ˆλ‹€.


3. λ§ˆμ§€λ§‰ λ‹¨κ³„μ—μ„œλŠ” μ™„μ „ν•œ κΈ°λŠ₯을 κ°–μΆ˜ SAM 2λ₯Ό μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€. 이 λ‹¨κ³„μ—μ„œλŠ” μž‘μ—…μžκ°€ 쀑간 ν”„λ ˆμž„μ—μ„œ μˆ˜μ •μ΄ ν•„μš”ν•œ 경우만 클릭해 μ£Όλ©΄ λ©λ‹ˆλ‹€. SAM 2λ₯Ό μ‚¬μš©ν•˜μ—¬ μ²˜μŒλΆ€ν„° λ‹€μ‹œ 주석 달 ν•„μš” 없이 마슀크λ₯Ό νŽΈμ§‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 이둜써 μ–‘μ§ˆμ˜ 데이터셋을 많이 ν™•λ³΄ν•˜κ³  λΉ„λ””μ˜€μ˜ λ§ˆμŠ€ν‚Ή λ°©λ²•κΉŒμ§€ ν•™μŠ΅ν•˜λ‚˜ SAM 2κ°€ 탄생할 수 μžˆμ—ˆμŠ΅λ‹ˆλ‹€.

SA-V 데이터셋 μ˜ˆμ‹œ 좜처: <SAM 2: Segment Anything in Images and Videos> (Ravi et al., 2024)

이미지 λΆ„ν• μ˜ 기반 λͺ¨λΈμ΄ 됐던 SAM이 ν•œ 번 더 μ§„ν™”ν•΄ 이제 λΉ„λ””μ˜€κΉŒμ§€ ν‰μ •ν–ˆμŠ΅λ‹ˆλ‹€. SAM으둜 νŒŒμƒλœ 연ꡬ가 λ‹€μ–‘ν–ˆλ˜ 만큼, 이번 SAM 2의 νŒŒκΈ‰λ ₯ λ˜ν•œ 클 κ²ƒμœΌλ‘œ λ³΄μ΄λŠ”λ°μš”. 일상 μƒν™œ 속 μ˜μƒ νŽΈμ§‘ κΈ°μˆ μ΄λ‚˜ μ˜μƒ λͺ¨λ‹¬λ¦¬ν‹°λ₯Ό λ‹€λ£¨λŠ” μ—°κ΅¬μ—μ„œ λ‹€μ–‘ν•œ λ°œμ „μ„ κΈ°λŒ€ν•˜κ² μŠ΅λ‹ˆλ‹€. 🌟

πŸ”₯8μ›” AI IgniteπŸ”₯

업계 μ’…μ‚¬μžλ“€μ„ μœ„ν•œ 밀도 높은 λ„€νŠΈμ›Œν‚Ή μ‹œκ°„, AI Igniteκ°€ λŒμ•„μ™”μŠ΅λ‹ˆλ‹€!


21일(수), ν™μ½©κ³ΌκΈ°λŒ€(HKUST) κ²Έμž„κ΅μˆ˜μ΄μž μ „ ν•˜λ‚˜κΈˆμœ΅μ§€μ£Ό 그룹데이터총괄인 ν™©λ³΄ν˜„μš°λ‹˜μ΄ AI Igniteλ₯Ό μ°Ύμ•„μ˜€μ‹­λ‹ˆλ‹€. 


ν˜„μš°λ‹˜μ€ 영ꡭ μΌ€μž„λΈŒλ¦¬μ§€ ꡭ제인λͺ…μ„Όν„°(IBC)λ‘œλΆ€ν„° β€˜λΉ…λ°μ΄ν„°, 인곡지λŠ₯ λΆ„μ•Ό 세계 100인의 전문가’에 μ„ μ •λœ 데이터 μ‚¬μ΄μ–ΈμŠ€ λΆ„μ•Όμ˜ 세계적인 μ „λ¬Έκ°€μž…λ‹ˆλ‹€.


ν˜„μš°λ‹˜κ³Ό ν•¨κ»˜ <AI μ‹œλŒ€μ˜ κ²½μŸμš°μœ„ μ „λž΅>에 λŒ€ν•΄ 이야기 λ‚˜λˆ„λŸ¬ μ˜€μ„Έμš”!

AI NEWS 

: Metaκ°€ μ˜€ν”ˆ μ†ŒμŠ€ 인곡지λŠ₯ λͺ¨λΈ 'Llama 3.1'을 μΆœμ‹œν–ˆμŠ΅λ‹ˆλ‹€. Llama 3.1이 λŒ€κ·œλͺ¨ λ‹€μ€‘μž‘μ—… μ–Έμ–΄ 이해(MMLU)μ—μ„œ OpenAI의 GPT-4o 및 Anthropic의 Claude 3.5 Sonnetλ₯Ό λŠ₯κ°€ν–ˆλ‹€λŠ”λ°μš”. 이번 Llama 3.1은 3κ°€μ§€ λ²„μ „μœΌλ‘œ, κ°€μž₯ 큰 버전은 4050μ–΅ 개(405B)의 λ§€κ°œλ³€μˆ˜λ₯Ό κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€. 


EU, 세계 졜초 AI λ²•μ•ˆ 발효

: μœ λŸ½μ—°ν•©(EU)은 μΈκ°„μ˜ κΈ°λ³ΈκΆŒμ„ λ³΄ν˜Έν•˜κ³  AI의 신뒰성을 보μž₯ν•˜κΈ° μœ„ν•΄ 세계 졜초둜 포괄적인 AI κ·œμ œλ²•μ„ μ§€λ‚œ 1일뢀터 μ‹œν–‰ν–ˆμŠ΅λ‹ˆλ‹€. μ…€λ ‰νŠΈμŠ€νƒ€λ„ 이 주제λ₯Ό λ‹€λ£¨μ—ˆμ§€μš”! ChatGPT, Claude 3.5 λ“±μ˜ λ²”μš© AIλŠ” 투λͺ…성을 ν™•λ³΄ν•˜κΈ° μœ„ν•΄ ν•™μŠ΅ 데이터λ₯Ό λͺ…μ‹œν•΄μ•Ό ν•˜λ©°, κ·œμ •μ„ μœ„λ°˜ν•  경우 μ΅œλŒ€ 7%의 κ³Όμ§•κΈˆμ΄ λΆ€κ³Όλ©λ‹ˆλ‹€. μ „λ©΄ μ‹œν–‰μ€ 2026λ…„ 8μ›” μ˜ˆμ •μž…λ‹ˆλ‹€.


OpenAI, SearchGPT λ°œν‘œ

: OpenAIκ°€ SearchGPTλ₯Ό λ°œν‘œν–ˆμŠ΅λ‹ˆλ‹€. μ‚¬μš©μžμ˜ μ§ˆλ¬Έμ— λŒ€ν•΄ μš”μ•½λœ 검색 결과와 μ†ŒμŠ€ 링크λ₯Ό μ œκ³΅ν•˜λ©°, 후속 질문과 상황에 λ§žλŠ” 응닡이 κ°€λŠ₯ν•©λ‹ˆλ‹€. ν˜„μž¬λŠ” 일뢀 μ‚¬μš©μžμ—κ²Œλ§Œ ν”„λ‘œν† νƒ€μž… 버전이 제곡되며, ν–₯ν›„ ChatGPTμ™€μ˜ 톡합될 κ³„νšμž…λ‹ˆλ‹€.

The Data-centric AI company


AI λ°μ΄ν„°μ˜ 기쀀을 λ§Œλ“­λ‹ˆλ‹€



πŸ“‹ 사업 및 제휴 λ¬Έμ˜ contact@selectstar.ai
πŸ“¨ μ½˜ν…μΈ  및 행사 문의 marketing@selectstar.ai