2024λ
5μ 3μ£Όμ°¨ μ
λ νΈμ€ν λ΄μ€λ ν° |
|
|
κΈ: μ΄μ±λ°°, λ₯λ€μ΄λΈ(deep daiv.) μ ν΄ μ½ν
μΈ γ
£ μλν°: μ μΈμ |
|
|
π° κ²μκ³Ό μμ±μ μν All in One μΈμ΄ λͺ¨λΈ |
|
|
μΈμ΄ λͺ¨λΈμ νκ° νμμ μ€μ΄κΈ° μν΄ κ²μ κ²°κ³Όλ₯Ό κΈ°λ°μΌλ‘ λ΅λ³μ μμ±νλ λνμ μΈ λ°©λ²μ΄ λ°λ‘ RAGμ
λλ€. RAGλ Retrieval-Augmented Generation, μ°λ¦¬λ§λ‘ βκ²μ μ¦κ° μμ±β κΈ°λ²μ μλ―Ένλλ°μ. μΈμ΄ λͺ¨λΈμ΄ μ§λ¬Έμ λν λ΅λ³μ μμ±νλ κ³Όμ μμ κ²μλ κ²°κ³Όλ₯Ό μΈμ΄ λͺ¨λΈμ μ
λ ₯κ°μΌλ‘ νμ©ν©λλ€. λ§μΉ κΆκΈν λ΄μ©μ ν¬νΈ μ¬μ΄νΈμμ κ²μν΄λ³΄λ κ²μ²λΌμ.
RAGλ₯Ό μν΄μλ μ§λ¬Έκ³Ό κ΄λ ¨λ μ μ ν λ¬Έμλ₯Ό μ°Ύλ κ²μ΄ μ€μν©λλ€. μ΄λ―Έ μ κ°μΆ°μ§ κ²μ μμ§μ νμ©νλ λ°©λ²λ μμ§λ§, νμ κ²μ μμ§μ νμ©ν μ μλ κ²μ μλλλ€. κΈ°μ
μ΄ λ³΄μ ν λ°μ΄ν°λ μ λ¬Έμ±μ΄ λμ μ 보 κ°μ κ²½μ° κ²μ κ²°κ³Όμμ μ°Ύμ μ μκ² μ£ . μ΄λ° κ²½μ°μλ λ³λμ λ°μ΄ν°λ² μ΄μ€λ₯Ό ꡬμΆνκ³ , μ§μ(Query)μ κ΄λ ¨λ λ¬Έμμ μ 보λ§μ νν°λ§ν΄μΌ ν©λλ€.
κ·Έλ λ€λ©΄ μ΄λ»κ² μ μ¬ν μ 보λ₯Ό νν°λ§ν μ μμκΉμ? λ¨Όμ , κ²μμ΄μ λ°μ΄ν°λ² μ΄μ€ λ΄μ λ¬Έμ κ°μ μ μ¬λλ₯Ό κ³μ°ν΄μΌ ν©λλ€. μ μ¬λλ₯Ό κ³μ°νκΈ° μν΄μλ κ° λ¬Έμλ₯Ό 벑ν°νν΄μΌ νλλ°μ. μ΄λ κ² λ¬Έμλ₯Ό 벑ν°ννλ κ³Όμ μ **μλ² λ©(Embedding)**μ΄λΌ ν©λλ€.
|
|
|
μΆμ²: A Gentle Introduction to Retrieval Augmented Generation (RAG)
λ¬Έμμ μλ² λ© κ³Όμ λ μΈμ΄ λͺ¨λΈλ‘ μ΄λ€μ§λλ°μ. μλ² λ©μ μν μΈμ΄ λͺ¨λΈμ λ΅λ³μ μμ±νλ μΈμ΄ λͺ¨λΈ(e.g. GPT)κ³Όλ λ€λ¦
λλ€. μλ² λ© λͺ¨λΈμ λ¬Έλ§₯μ μ΄ν΄νλ λ°, μμ±ν μΈμ΄ λͺ¨λΈμ λ€μ λ¨μ΄λ₯Ό μμΈ‘νλ λ° νΉνλμ΄ μμ΅λλ€. λ λ€ μΈμ΄ λͺ¨λΈμ΄μ§λ§ κ°μκ° μνλ μν μ΄ λ€λ₯΄λ€ 보λ, κ°μ μ§λ¬Έλ κ°κ° μ
λ ₯λΌμΌ ν©λλ€. λΉμ°ν κ³μ° λν λ λ² μ΄λ€μ ΈμΌ νκ³ μ. μ΄λκ° λΉν¨μ¨μ μ΄μ§μ?
κ·Έλμ λ μΈμ΄ λͺ¨λΈμ ν΅ν©νλ €λ μλκ° μ΄μ΄μ§κ³ μμ΅λλ€. μ¦, κ²μμ μν μλ² λ©κ³Ό λ΅λ³ μμ±μ λͺ¨λ ν΄λ΄λ μ¬μΈμ μΈμ΄ λͺ¨λΈμ΄λΌκ³ ν μ μμ£ . μ΄λ² λ΄μ€λ ν°μμλ μ²μμΌλ‘ μμ±κ³Ό μλ² λ©μ ν΅ν©νκ³ μ ν μΈμ΄ λͺ¨λΈ GRITμ μμ보λλ‘ νκ² μ΅λλ€.
|
|
|
GRIT: Generative Representational Instruction Tuning |
|
|
μΆμ²: Generative Representational Instruction Tuning (Muennighoff et al., 2024)
GRITμ μ΄λ»κ² νμ΅νκΈ°μ λ λ₯λ ₯μ λͺ¨λ μ»μμκΉμ? GRITμ νλμ λͺ¨λΈμ μλ² λ© νν(Representation)κ³Ό μμ±(Generation)μ μν΄ *Instruction Tuningμ νμ΅λλ€.
|
|
|
μλ² λ©μ μν΄μλ μ’μ 벑ν°κ°μ μ»μ΄μΌ νκ³ , μμ±μ μν΄μλ μ μ ν λ€μ ν ν°μ μ»μ΄μΌ ν©λλ€. νμ΅νλ κ³Όμ μ κ°μ§λ§ μ΅μ’
μ μΌλ‘ μ»μ΄μΌνλ κ²μ΄ λ€λ₯΄κΈ° λλ¬Έμ λͺ¨λΈμ μ΅μ’
λ¨κ³μ μ½κ°μ μ°¨μ΄λ₯Ό μ€λλ€.
|
|
|
μΆμ²: Generative Representational Instruction Tuning (Muennighoff et al., 2024)
μμ κ·Έλ¦Όμμ μ μ μλ―μ΄, μλ² λ© νμ€ν¬μμλ λ§μ§λ§ μλμΈ΅(Hidden State)μ κ°μ€μΉ κ°μ νκ· μ λ΄κ³ (Mean Pooling), μμ± νμ€ν¬μμλ λ§μ§λ§ μλμΈ΅μμ λ€μ ν ν°μ μμΈ‘νλλ‘ ν©λλ€. μ¬κΈ°μ Instructionμ νΉμν ν ν°μ μΆκ°ν΄ μ΄λ€ νμ€ν¬λ‘ νμ΅ν μ§ κ²°μ ν©λλ€. μ΄ κ³Όμ μ κ·Έλ¦ΌμΌλ‘ λνλ΄λ©΄ μλμ κ°μ΅λλ€.
|
|
|
μΆμ²: Generative Representational Instruction Tuning (Muennighoff et al., 2024)
GRIT λͺ¨λΈμ λμΌν ννλ‘ Instructionμ΄ μ
λ ₯λμ§λ§ μΆλ ₯νλ κ²°κ³Όλ λ€λ₯Έ κ²μ λ³Ό μ μλλ°μ. μ¬κΈ°μ μ’μ μλ² λ© κ²°κ³Όλ₯Ό μ»κΈ° μν΄, ννμ μν Instruction Tuningμ νμ΅ λ°μ΄ν°λ λΆμΌ(Domain), μλ(Intent), **ν
μ€νΈμ λ¨μ(Unit)**μ λͺ
μμ μΌλ‘ μΆκ°ν©λλ€. κ°μ₯ μμ μμμμλ κ³Όν(Scientific) λΆμΌμ λν΄, λ
Όλ¬Έμ μ΄λ‘(Abstract) λ¨μμμ κ²μ(Retrieve)νκ³ μ νλ μλλ₯Ό λ°μν΄ μ§μν κ²μ λ³Ό μ μμ΅λλ€.
Instruction Tuningμ μν΄μλ κΈ°λ° λͺ¨λΈ(Base Model)μ΄ νμν©λλ€. GRIT λͺ¨λΈμ Mistral 7B λͺ¨λΈμ κΈ°λ°μΌλ‘ νμ¬ μΆκ°μ μΈ Instructionμ νμ΅μμΌ°μ΅λλ€. μλ² λ©κ³Ό μμ±μ΄λΌλ λ κ°μ§ λͺ©νλ₯Ό λͺ¨λ λ¬μ±νκΈ° μν΄ λ λ§μ νμ΅ νμκ° νμνμ§λ§ μ΅μ’
μ μΌλ‘λ λ λ₯λ ₯μμ λͺ¨λ μ€μν μ±λ₯μ 보μ νκ² λμ΅λλ€(π GritLM GitHub λ§ν¬).
|
|
|
RAGμ νμ©ν μ μμκΉ? |
|
|
κΈ°μ‘΄ λ°©μμ RAGλ μ§μλ¬Έμ βμλ² λ© λͺ¨λΈβμ μ
λ ₯νκ³ , κ²μλ κ²°κ³Όμ ν¨κ» μ§μλ¬Έμ λ€μ βμμ± λͺ¨λΈβμ μ
λ ₯ν΄μΌ νμ΅λλ€. νμ§λ§ νλμ μΈμ΄ λͺ¨λΈμ μ΄ λ κ°μ§ κΈ°λ₯μ ν΅ν©ν¨μΌλ‘μ¨ λΉν¨μ¨μ±μ μ€μΌ μ μμλλ°μ. μ΄λ―Έ ν λ² κ³μ°ν μ 보μ λν΄ *μΊμ(Cache)μ μ μ₯νμ¬ κ²μ μλλ₯Ό λΉμ½μ μΌλ‘ μ€μΈ κ²μ
λλ€.
|
|
|
μΆμ²: Generative Representational Instruction Tuning (Muennighoff et al., 2024)
GRITμ Query-Doc Caching λ°©λ²μ μ΄ν΄λ³΄κ² μ΅λλ€. λ¨Όμ GRIT λͺ¨λΈ(GritLM)μ μ
λ ₯λ μ§λ¬Έμ λν΄ λ²‘ν° μ°μ°μ μ§νν©λλ€. μ΄ λ²‘ν°λ λ¬Έμ κ²μμ μν λͺ©μ κ³Ό μμ±μ μν 쑰건(Condition) λͺ©μ μΌλ‘ λͺ¨λ νμ©μ΄ κ°λ₯ν©λλ€. λ°λΌμ λ λ² μ°μ°νμ§ μκ³ , 1μ°¨ μΊμ(1st Cache)μ μ μ₯ν΄λμ£ . κ²μλ λ¬Έμμ λν΄μλ λμΌνκ² μ μ©μ΄ κ°λ₯νλ°μ. κ²μλ λ¬Έμ λ²‘ν° μμ GritLMμΌλ‘ ꡬν λ§νΌ μμ±μ νμ©ν μ μμ΅λλ€. μ΄ μ 보λ 2μ°¨ μΊμ(2nd Cache)μ μ μ₯λ©λλ€. μ΄λ κ² λ κ°μ§ μ 보λ₯Ό λͺ¨λ GritLMμ μ
λ ₯κ°μΌλ‘ νμ©ν΄ μνλ λ΅λ³μ μμ±ν΄λ΄λ κ²μ΄ Query-Doc Cachingμ μ리μ
λλ€..
νμ§λ§ μμ§ μ€μ RAGμ νμ©νκΈ°μλ μ±λ₯μ΄ κ·Έλ¦¬ μ’μ§ μμ΅λλ€. RAGλ₯Ό μ¬μ©ν κ²°κ³Όκ° RAGλ₯Ό μ¬μ©νμ§ μμ κ²°κ³Όμ ν° μ°¨μ΄κ° μλ κ²μΌλ‘ λνλ¬λλ°μ. μ΄μ λν΄ μ°κ΅¬μ§μ GRIT λͺ¨λΈμ΄ ν΄λΉ λ°©μμ λν΄ νμΈνλλμ§ μμκΈ° λλ¬Έμ΄λΌκ³ μ€λͺ
ν©λλ€.
|
|
|
GRITμ Mistral 7Bλ₯Ό κΈ°λ°μΌλ‘ νμ§λ§, νμ΅ κ΅¬μ‘°μ νΉμ±μ μ΄λ€ λͺ¨λΈμλ μ΄μ κ°μ μμ€ν
μ ꡬνν μ μμ΅λλ€. μ μ¬μ μΌλ‘ λ€λ₯Έ λͺ¨λΈμ λν΄μλ μ°κ΅¬ν λ§ν μ¬μ§κ° λ§λ€λ μλ―Έμ§μ. νμ¬ κ°μ₯ λ°μ΄λ μ±λ₯μ 보μ΄λ GPT-4λ Gemini Pro κ°μ λͺ¨λΈμ λν΄μλ μ μ©νλ€λ©΄ ν¨μ¬ μ μ λΉμ©μΌλ‘ RAGλ₯Ό ꡬνν μ μλ€λ ν¬λ§μ 보μ¬μ£ΌκΈ°λ ν©λλ€. λ¬Όλ‘ , λ λ§μ μ°κ΅¬κ° νμνκ² μ§λ§μ.
|
|
|
: λ¨λ°±μ§μ 3μ°¨μ ꡬ쑰λ₯Ό μμΈ‘νλ AI λͺ¨λΈ AlphaFold 3κ° κ³΅κ°λμ΅λλ€. AlphaFold 2κ° κ³΅κ°λ μ§ 4λ
λ§μ
λλ€. AlphaFold 3λ μ΄μ λͺ¨λΈμ Evoformer λͺ¨λμ λμ± κ°μ ν Pairformerλ₯Ό ꡬ쑰λ₯Ό μ 보μλλ°μ. μλ‘μ΄ νμ΅ κ΅¬μ‘° λλΆμ λΆμ κ° μνΈμμ© μμΈ‘ λ₯λ ₯μ΄ ν¬κ² κ°μ λμ΅λλ€.
AI μ₯μ°©ν μμ΄ν¨λ νλ‘
: Appleμ 7κ°μλ§μ AI μΉ© βM4βλ₯Ό μ 보μμ΅λλ€. μ΄λ²μ λ°νλ M4λ μλ‘κ² μΆμλλ μμ΄ν¨λ 11μΈλμ λ°μλ μμ μ
λλ€. M4 μΉ©μ M2μ λΉκ΅ν΄ μ΅λ 1.5λ°° ν₯μλ μλμ CPUλ₯Ό μ 곡νλ©°, AI κΈ°κ³ νμ΅μ κ°μνκΈ° μν λ΄λ΄ μμ§ μ±λ₯μ νμ‘΄ μ΅κ³ λΌκ³ ν©λλ€.
OpenAI, μ
κ·Έλ μ΄λ GPT-4o 곡κ°
: OpenAIκ° κ³΅κ°ν μλ‘μ΄ λ©ν°λͺ¨λ¬ λͺ¨λΈ GPT-4oλ νΉν μ€λμ€ μ±λ₯μ΄ λΉμ½μ μΌλ‘ κ°μ λλλ°μ. μ¬λμ λ°μ μλμ μ μ¬νκ² μ€λμ€ μλ΅μ κ²°κ³Όλ₯Ό λ°νν©λλ€. μ΄λ² λͺ¨λΈμ κ²½μ° λΉμμ΄κΆ λͺ¨λΈμ λν μ±λ₯λ ν¨μ¬ κ°μ λμΌλ©°, GPT-4 Turboλ³΄λ€ μλλ 2λ°°, λΉμ©μ 0.5λ°° λΌκ³ ν©λλ€.
|
|
|
Data-centric AI company
μΈμ λͺ¨λ λ°μ΄ν°λ₯Ό μ°Ύμ, μ
λ νΈμ€νλ
AI λΌμ΄νμ¬μ΄ν΄μ ν¨κ»νλ μ¬μΈμ λ°μ΄ν° νλ«νΌμ
λλ€.
|
|
|
π μ¬μ
λ° μ ν΄ λ¬Έμ contact@selectstar.ai
π¨ μ½ν
μΈ λ° νμ¬ λ¬Έμ marketing@selectstar.ai
|
|
|
|
|