๐ก LLM
- Large Language Model
- ๋ฅ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ๊ณผ ํต๊ณ ๋ชจ๋ธ๋ง์ ํตํด ์์ฐ์ด ์ฒ๋ฆฌ ์์ ์ ์ํํ๋๋ฐ์ ์ฌ์ฉ
- ๋๊ท๋ชจ ์ธ์ด ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ๋ฌธ์ฅ ๊ตฌ์กฐ๋ ๋ฌธ๋ฒ, ์๋ฏธ ๋ฑ์ ์ดํดํ๊ณ ์์ฑํ ์ ์๋ค
๐ก sLM ๊ณผ์ ์ฐจ์ด
- sLm (small Language Model)
- sLLM (small Large Language Model) : LLM ์ค์์๋ ์๋์ ์ผ๋ก ์์ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง ๋ชจ๋ธ
- ⇒ ์์ฐ์ด ์ฒ๋ฆฌ (NLP) ๋ถ์ผ์์ ์ฌ์ฉ๋๋ ์ธ๊ณต์ง๋ฅ ์ธ์ด ๋ชจ๋ธ์ ํฌ๊ธฐ๋ ๋ฅ๋ ฅ์ ๊ตฌ๋ถ
๐ก ํ๋ผ๋ฏธํฐ
- LLM์ ์์ฒญ๋ ์์ ํ๋ผ๋ฏธํฐ๋ก ์ ์๋จ (⇒ Large์ ์๋ฏธ๋ ๋ชจ๋ธ์ด ๊ฐ์ง Parameter๊ฐ ๋ง๋ค๋ ๊ฒ์ ์๋ฏธ)ex) BERT : ์์ต๊ฐ์ ํ๋ผ๋ฏธํฐ
- ex) BERT : ์์ต๊ฐ์ ํ๋ผ๋ฏธํฐ
- ex) gpt-3 : 1750์ต๊ฐ์ ํ๋ผ๋ฏธํฐ
๐ก RAG (Retrieval-Augmented Generation)
- ๊ฒ์ ์ฆ๊ฐ ์์ฑ
- ๊ธฐ์กด์ ์ธ์ด ๋ชจ๋ธ์ ์ธ๋ถ ์ง์์ ๊ฒฐํฉํ์ฌ ๋์ฑ ์ ํํ๊ณ ์ต์ ์ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ์ ๊ทผ ๋ฐฉ์
- LLM์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ๊ฐ๋ฐ๋์
๐กLLM์ ํ๊ณ
- ๊ธฐ์กด์ LLMs๋ ํ์ต ์์ ์ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐํ์ฌ ์ง์์ ์ต๋
- 2023๋ ๊น์ง์ ๋ฐ์ดํฐ๋ก ํ์ต๋ ๋ชจ๋ธ์ 2024๋ ์ดํ์ ์ฌ๊ฑด๋ค์ ๋ํด ๋ต๋ณ ๋ถ๊ฐ
- ํ๊ฐ๋ฌธ์ (Hallucination)
- ์ค์ ๋ก ์กด์ฌํ์ง ์๋ ์ ๋ณด๋ฅผ ์์ฑํ๋ ‘ํ๊ฐ’ ํ์์ ๋ณด์
- ๊ทธ๋ด๋ฏํ ๋ต๋ณ์ ํ์ง๋ง, ์ค์์ ๋ค๋ฅผ ์ ์์
- ์ถ์ฒ ์ถ์ ์ ์ด๋ ค์
- ๊ธฐ์กด ๋ชจ๋ธ๋ค์ ์์ฑํ ์ ๋ณด์ ์ถ์ฒ๋ฅผ ๋ช ํํ ์ ์ํ๊ธฐ ์ด๋ ค์
- ๋๋ฉ์ธ ํนํ ์ง์์ ํ๊ณ
- ๋ฒ์ฉ LLMs๋ ๊ด๋ฒ์ํ ์ฃผ์ ๋ฅผ ๋ ๋ง์ด ์๊ณ , ํน์ ๋๋ฉ์ธ์ ์ฌ๋ ์๋ ์ ๋ฌธ ์ง์์ ๋ชจ๋ ํฌํจํ๊ธด ์ด๋ ค์
∴ RAG๊ฐ ์๋ค๋ฉด, LLM์ ์ฌ์ฉ์ ์ ๋ ฅ์ ๋ฐ์ ํ๋ จํ ์ ๋ณด ๋๋ ์ด๋ฏธ ์๊ณ ์๋ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ต์ ์์ฑํ๊ฒ ๋จ
๐กRAG ์๋ฏธ
- ๊ฒ์ (Retrieval)
- ์ฌ์ฉ์์ ์ง๋ฌธ์ ๋ถ์ํ์ฌ ๊ด๋ จ ํค์๋๋ฅผ ์ถ์ถํ๊ณ , ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ธ๋ถ db๋ ์ง์ ๊ธฐ๋ฐ์์ ๊ด๋ จ ์ ๋ณด๋ฅผ ๊ฒ์
- ๋ฒกํฐ ์ ์ฌ๋ ๋ฑ์ ๊ธฐ์ ์ ํ์ฉํด์ ๋ฌธ์๋ ์ ๋ณด ์ ๋ฐ
- ์ฆ๊ฐ (Augmentation)
- ๊ฒ์๋ ์ ๋ณด๋ฅผ LLM์ ์ ๋ ฅ์ ์ถ๊ฐ
- ์ด ๊ณผ์ ์์ ๊ฒ์ ๊ฒฐ๊ณผ๋ฅผ ์์ฝํ๊ฑฐ๋, ์ฌ๊ตฌ์ฑํ์ฌ LLM์ด ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ ์ ์๋ ํํ๋ก ๊ฐ๊ณต
- ์์ฑ (Generation)
- ์ฆ๊ฐ๋ ์ ๋ ฅ์ ๋ฐํ์ผ๋ก LLM์ด ์ต์ข ์๋ต์ ์์ฑ
- ์ด ๊ณผ์ ์์ LLM์ ๊ฒ์๋ ์ ๋ณด์ ์์ฒด ํ์ต๋ ์ง์์ ๊ฒฐํฉํ์ฌ ๋ณด๋ค ์ ํํ๊ณ ๋งฅ๋ฝ์ ๋ง๋ ์๋ต์ ์์ฑ
- ํ์์ ๋ฐ๋ผ ์์ฑ๋ ์๋ต์ ํ์ง์ ํ๊ฐํ๊ณ ๊ฐ์ ํ๋ ๊ณผ์ ์ ๊ฑฐ์นจ
๐ก PEET (Parameter-Efficient Fine-Tuning)
- ์ ์ ์์ ๋งค๊ฐ๋ณ์๋ฅผ ํ์ตํ๋ ๊ฒ ๋ง์ผ๋ก๋ ๋น ๋ฅธ ์์ผ ์์ ์๋ก์ด ๋ฌธ์ ๋ฅผ ๋น์ทํ ์ฑ๋ฅ์ผ๋ก ํ ์ ์๊ฒ ํ๊ธฐ ์ํ ๋ฏธ์ธ์กฐ์ (Fine-Tuning) ๋ฐฉ๋ฒ๋ก
- ๋ชจ๋ธ ์ ์ฒด๋ฅผ ๋ฏธ์ธ์กฐ์ ํ๋ ๊ฒ๋ณด๋ค, ํจ์ฌ ์ ์ ๊ณ์ฐ ์์๊ณผ ๋ฐ์ดํฐ๊ฐ ํ์ํจ
- ๋ค์ํ ํ์คํฌ๋ ๋ฌธ์ ์ ๋ํด ๋ชจ๋ธ์ ๋น ๋ฅด๊ฒ ์ ์ฉํ๊ฑฐ๋, ์คํํ๋ ค๋ ์ฐ๊ตฌ์๋ ๊ฐ๋ฐ์์๊ฒ ๋งค์ฐ ์ ์ฉํจ
- LLM์ weight๋ ์ต์ 1.5GB ~ 3GB
- Model์ GPU์ ๋ก๋ํ๋ ๊ฒ๋ง ํด๋, ์์ฒญ๋ GPU ํฌ๊ธฐ ์๋ชจ
- Fine-Tuning์ ์ฃผ๋ก Forward, Backward, ์ด๋ฅผ ํตํ Update๋ก ์ด๋ค์ง๋๋ฐ ์ด๋ ๋ฐ๊ฒฌ๋ gradient์ optimizer๋ฅผ ๋ชจ๋ GPU์ ์ ์ฅํด์ผ ํจ.
- ๊ฒฐ๊ตญ, Fully Fine-Tuning ์, weight ์ * 2 ~ 3๋ฐฐ์ GPU ์ฉ๋์ด ํ์ํจ
- ๐กFully Fine-Tuning์ด ํ๋ ์ด์
์ฌ์ ํ์ต๋ LLM ๋ชจ๋ธ ์์ ์์ ๋ ์ด์ด๋ฅผ ์ถ๊ฐํ์ฌ ํ์ธํ๋ํ๋ ๋ฐฉ์ ๋๋ถ์ ์๋ก์ด ํ์คํฌ์ ๋ํ ๋ชจ๋ธ์ ์ ์ฉ ๋ฐ ํ๊ฐ๋ฅผ ์ํ ๊ฐ๋ฅ
๐ก LoRA (Low-Rank Adaptation)
- Huggingface์์ ๊ฐ๋ฐํ Parameter-Efficient Fine-Tuning ๋ฐฉ์ (PEET) ์ค ํ๋
- ์ธ์ด ๋ชจ๋ธ์ ๊ตฌ์ฑํ๋ ๋๋ถ๋ถ์ ๋งค๊ฐ๋ณ์ (parameter)์ ๊ฐ์ค์น (weight)๋ฅผ ๊ทธ๋๋ก ์ ์งํ ์ฑ, ์ผ๋ถ ๋งค๊ฐ๋ณ์์๋ง ํ์ธํ๋์ ์ ์ฉํ์ฌ ๊ฐ์ค์น๋ฅผ ๋ณ๊ฒฝํ๋ ํ์ธ ํ๋ ๋ฐฉ์ ⇒ ํน์ ๋ถ๋ถ๋ง ์ง์ค์ ์ผ๋ก ์์ ํ์ฌ ์์ ์ ๋ํ ์ฑ๋ฅ์ ๊ฐ์
- ํ์ด์ฌ์ peft ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ฝ๊ฒ LoRA๋ฅผ ์ฌ์ฉํ ์ ์์
๐ก SaaS
- SaaS๋ ๊ธฐ์ ์ฉ ์ํํธ์จ์ด๋ก, ๊ณ ๊ฐ๋ค์ ์๊ตฌ์ฌํญ์ ๋ง์ถฐ ์ํํธ์จ์ด ์๋น์ค๋ฅผ ์ ๊ณตํด์ฃผ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
- ์ฌ์ฉ์์ ์์ฒญ์ ๋ฐ๋ผ ๊ธฐ๋ฅ์ ์ถ๊ฐํ๊ฑฐ๋ ์ฉ๋์ ๊ด๋ฆฌํ๋ฉฐ, ์ธ์ ์ด๋์๋ ์ง ์ธํฐ๋ท๋ง ์์ผ๋ฉด ์ฌ์ฉ๊ฐ๋ฅํ๋ค๋ ์ ์ ๋ฐ์ ๊ฐ๋ฅ์ฑ์ด ๋์ ์์ฅ์ด๋ผ ์๊ฐํฉ๋๋ค.
๐ก LLM & SaaS
- LLM์ด๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ๋ก ๋ฐ์ดํฐ๋ฅผ ๋๊ท๋ชจ๋ก ํ์ตํ์ฌ ์๊ตฌ์ฌํญ์ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ์ ์๋ฏธํฉ๋๋ค.
- LLM์ Text์ Code๋ฅผ ๋ณํํ๊ฑฐ๋, ๋๋ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ฅผ ๋ณํํ์ฌ ์์ฐ์ด ๊ธฐ๋ฐ์ ์ฝ๋๋ฅผ ์์ฑํฉ๋๋ค.
- ์ด๋ฌํ LLM์ ์ฌ์ฉํ๋ค๋ฉด, SaaS ํ๋ซํผ ๊ฐ๋ฐ์ ๋์์ด ๋ ๊ฒ ์ด๋ค.
- ํนํ, ๊ณ ๊ฐ์ ์๊ตฌ์ฌํญ์ ์กฐ๊ธ ๋ ๋น ๋ฅด๊ณ , ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ์ฌ, SaaS ์๋ฃจ์ ์ ํ์ง์ ๋์ผ ์ ์์ ๊ฒ์ ๋๋ค.
๐ก ์ต์ LLM (2024)
- Llama 3.1 (๋ผ๋ง) https://yongeekd01.tistory.com/205
- ๋ฉํ์์ ๋ฐํ
- ์ปจํ ์คํธ ๊ธธ์ด๊ฐ 128K๋ก ํ์ฅ
- 8๊ฐ ์ธ์ด ์ง์์ด ์ถ๊ฐ๋จ
- ์ต์ด์ ํ๋ก ํฐ์ด๊ธ ์คํ์์ค AI ๋ชจ๋ธ์ธ Llama 3.1 405B๊ฐ ํฌํจ๋จ
- 16,000๊ฐ ์ด์์ H100 GPU๋ก ๋ฐ์ด๋ถ์ฌ 405B๋ฅผ ์ด ๊ท๋ชจ๋ก ํ๋ จ๋ ์ต์ด์ ๋ผ๋ง ๋ชจ๋ธ
- Mistral Large 2 https://yongeekd01.tistory.com/207
- ์ ๋ฝ ์ธ๊ณต์ง๋ฅ ์คํํธ์ ๋ฏธ์คํธ๋ AI๊ฐ ํ๋๊ทธ์ฝ LLM ์ ์ ๊ท ๋ฒ์
- 1230์ต๊ฐ (123B)์ ๋งค๊ฐ๋ณ์, 12๋ง 8000ํ ํฐ์ ์ปจํ ์คํธ ์ฐฝ์ ์ ๊ณต (⇒ ๋ผ๋ง 3.1 ์ค ๊ฐ์ฅ ํฐ ๋ชจ๋ธ (405B)์ ๋นํด ๋งค๊ฐ๋ณ์๊ฐ 1/3 ํฌ๊ธฐ)
- ์ถ๋ก , ์ฝ๋ ์์ฑ ๋ฐ ์ํ ์ ๋ฐ์ ๊ฑธ์ณ ์ฑ๋ฅ ๊ฐ์
- ์ธ์ด ์ง์ : ํ๊ตญ์ด, ์์ด, ํ๋์ค์ด, ๋ ์ผ์ด, ์คํ์ธ์ด, ์ดํ๋ฆฌ์์ด, ํฌ๋ฅดํฌ๊ฐ์ด, ์๋์ด, ํ๋์ด, ๋ฌ์์์ด, ์ค๊ตญ์ด, ์ผ๋ณธ์ด (12๊ฐ) + ํ๋ก๊ทธ๋๋ฐ ์ธ์ด (80๊ฐ)
- ํฉ์ฑ ํ ์คํธ ์์ฑ, ์ฝ๋ ์์ฑ, ๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG)์ ๊ฐ์ด ๋์ ์ถ๋ก ๋ฅ๋ ฅ์ด ํ์ํ๊ฑฐ๋ ๋งค์ฐ ํน์ํ๋ ์์ ์ ํจ๊ณผ์
๐ก Lang Chain
- ์ธ์ด ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ฐ๋ฐํ๊ธฐ ์ํ ํ๋ ์์ํฌ
- ์ธ์ด ๋ชจ๋ธ์ API๋ฅผ ํตํด ํธ์ถ (๋ผ์ด๋ธ๋ฌ๋ฆฌ ํธ์ถ)
- ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ์ธ์ ๋ฐ ํ ์์คํ ๊ณผ์ ์ํธ์์ฉํ๋ ์ ํ๋ฆฌ์ผ์ด์ ๊ฐ๋ฐ
๐ก GPT-4o
- ์งํผํฐ ํฌ์ค๋ผ๊ณ ์ฝ์
- ์ฌ๊ธฐ์ ‘o’๋ “๋ชจ๋ ”, “์ ์ฒด์”๋ผ๋ ๋ป์ ์ ๋ฌํ๋ ์ ๋์ฌ์ธ ‘Omni’์ ์ฝ์
- ํ ์คํธ๋ฟ๋ง ์๋๋ผ ์ด๋ฏธ์ง, ์์ฑ ๋ฑ ‘๋ชจ๋ ’ ํํ์ ์ ๋ ฅ์ ์ดํดํ๊ณ ์ฒ๋ฆฌํ ์ ์๋ ๋ฅ๋ ฅ์ด ์๋ค๋ ๊ฑธ ๊ฐ์กฐํ๋ ค๋ ์๋๊ฐ ๋ด๊ธด ์ด๋ฆ
- GPT-4o๋ ๊ฐ์ฅ ๋น ๋ฅด๊ณ ์ ๋ ดํ ๋ชจ๋ธ, GPT-4๋ ์ด์ ์ ๊ณ ์ง๋ฅ ๋ชจ๋ธ
- GPT-4o๊ฐ ๋ณด๊ณ , ๋ฃ๊ณ , ๋งํ ์ ์๋ค๋ ๊ฒ์ ๋๋ค. ํธ๋ํฐ ์นด๋ฉ๋ผ๋ฅผ ํตํด์ ์ฌ๋์ ํ์ ์ ์ฝ์ ์ ์๊ณ , ์ฌ๋๊ณผ ๋ํํ๋ ๊ฒ๊ณผ ์ ์ฌํ ์๋๋ก ๋ํ๋ฅผ ํ ์ ์์ต๋๋ค.
- GPT-4o๋ 232๋ฐ๋ฆฌ ์ด์์ ์๋ตํ ์ ์๋๋ฐ, ์ด๊ฑด ์ธ๊ฐ๋ผ๋ฆฌ ๋ํ๊ฐ ์ค๊ฐ๋ ์๋๋ ๋น์ทํ ์์น
- GPT-4o๋ ์์ด ์ธ ์ธ์ด ๋ฅ๋ ฅ๋ ๊ฐ์
๐ก Claude 3.5 Sonnet
- Anthropic์ฌ์ ๋ฐํ์ ๋ฐ๋ฅด๋ฉด, Claude 3.5 Sonnet์ ๊ฑฐ์ ๋ชจ๋ ๋ฒค์น๋งํฌ ํ ์คํธ์์ OpenAI์ GPT-4์ Google์ Gemini 1.5 Pro์ ๊ฐ์ ๋ค๋ฅธ ์ ๋ช AI ๋ชจ๋ธ๋ค์ ๋ฅ๊ฐ
๐ก ์ฐจ์ด
- ํ์ผ ํธํ์ฑ: GPT-4o๊ฐ ๋ค์ํ ํ์ผ ํ์์ ์ง์ํ๋ฉฐ ์ฐ์ํ ํธํ์ฑ์ ๋ณด์๋ค.
- ์ธ์ด ๋ฅ๋ ฅ๊ณผ ์ถ๋ก ๋ฅ๋ ฅ: ํด๋ก๋ 3.5 Sonnet์ด ์ด ๋ถ๋ถ์์ ์ฝ๊ฐ ๋ ๋ฐ์ด๋ ๋ชจ์ต์ ๋ณด์ฌ์ฃผ์๋ค.
- ๋ฐ์ดํฐ ๋ถ์: GPT-4o๊ฐ ์ด ์์ญ์์ ๋ ๊ฐ์ ์ ๋ณด์๋ค.
'AI' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
LoRA, QLoRA, LoRA-FA ๋ถ์ (0) | 2024.11.18 |
---|---|
Continue Extension์ ํ์ฉํ AI Coding ํ๊ฐ (2) | 2024.10.21 |
Prompt๋ ? (feat. LLM) (0) | 2024.08.28 |
Ollama / Embedding (0) | 2024.08.27 |
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ (0) | 2023.05.09 |