๐ก Ollama
- ๋ก์ปฌ์์ ๋ํ ์ธ์ด ๋ชจ๋ธ (LLM)์ ์ฝ๊ฒ ์ฌ์ฉํ ์ ์๋๋ก ์ง์ํ๋ ํ๋ซํผ
- macOs, Windows, Linux์์ ๊ฐํธํ๊ฒ ์ค์นํ ์ ์์
- Docker๋ฅผ ์ง์ํ์ฌ ๋์ฑ ๋ค์ํ ํ๊ฒฝ์์ ํ์ฉ ๊ฐ๋ฅ
ollama run llama3 //์ถ์๋ AI ๋ชจ๋ธ์ RUN ๊ฐ๋ฅ
example
- Ollama๋ ์น UI ๊ธฐ๋ฅ์ ์ ๊ณต
๊ฐ์ด๋๋ผ์ธ
- Ollama ์๋ฒ ์คํ
OLLAMA_ORIGINS=* ollama serve- chatbot-ollama ์ฝ๋ ๋ค์ด๋ก๋ ๋ฐ ํจํค์ง ์ค์น
git clone git@github.com:ivanfioravanti/chatbot-ollama.git cd chatbot-ollama npm install- chatbot-ollama ์น ์๋ฒ ์คํ
npm run dev- Ollama ์น UI ์ ์ (http://localhost:3000 ์ ์)
๐ก Embedding
- ์ฌ๋์ด ์ฐ๋ ์์ฐ์ด๋ฅผ ๊ธฐ๊ณ๊ฐ ์ดํดํ ์ ์๋ ์ซ์์ ๋์ด์ธ ๋ฒกํฐ๋ก ๋ฐ๊พผ ๊ฒฐ๊ณผ ๋ฐ ๊ณผ์
- ๋จ์ด์ ๋น๋๋ฅผ ๊ทธ๋๋ก ๋ฒกํฐ๋ก ์ฌ์ฉํ๋ ๊ฒ
- ๋ณํ์ํจ ๋ฒกํฐ ๊ฐ์ ์๋ฏธ์ ์ ๋ณด๋ฅผ ์์ค์์ด ์ ๋ด์๋ผ์๋ก ์ข์ ์๋ฒ ๋ฉ
๐ก Embedding์ ์ญํ
- ๋จ์ด/๋ฌธ์ฅ ๊ฐ ๊ด๋ จ๋ ๊ณ์ฐ
- ๊ตฌ๊ธ์์ ๋ฐํํ “Word2Vec” : ๊ธ์๋ฅผ ๋ฒกํฐ ๊ฐ์ผ๋ก ๋ณํ
- ๋จ์ด ๋ฒกํฐ๋ค ์ฌ์ด์ ์ ์ฌ๋ ๊ณ์ฐ ๊ฐ๋ฅ
์ฝ์ฌ์ธ ์ ์ฌ๋- ๋ ๋ฒกํฐ๊ฐ์ ์ฝ์ฌ์ธ ๊ฐ์ ์ด์ฉํ์ฌ ๊ตฌํ ์ ์๋ ๋ ๋ฒกํฐ์ ์ ์ฌ๋
- 1์ ๊ฐ๊น์ธ ์๋ก ์ ์ฌ๋๊ฐ ๋๋ค.
- ์๋ฏธ์ /๋ฌธ๋ฒ์ ์ ๋ณด ํจ์ถ
- ๋ฒกํฐ์ธ ๋งํผ ์ฌ์น์ฐ์ฐ์ด ๊ฐ๋ฅ
⇒ ๋จ์ด๋ค ๊ฐ์ ๋ง์ /๋บ์ ์ ํตํด ๋จ์ด๋ค ์ฌ์ด์ ๊ด๊ณ๋ฅผ ๋์ถ ๊ฐ๋ฅ - ex) ๋จ์ด ๋ฒกํฐ 1 - ๋จ์ด ๋ฒกํฐ 2 + ๋จ์ด ๋ฒกํฐ 3
“์๋ ” - “์๋ ” + “์๋ ” = “์๋ ” (’์ฑ๋ณ’๋ก ์นํ ์)
“์๋ค” - “๋ธ” + “์๋ ” = “์๋ ” ์, ์ฑ๊ณต์
- ๋ฒกํฐ์ธ ๋งํผ ์ฌ์น์ฐ์ฐ์ด ๊ฐ๋ฅ
- ์ ์ดํ์ต
- ๋ค๋ฅธ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ ๋ ฅ๊ฐ์ผ๋ก ์์ฃผ ์ฐ์ด๊ณ , ํ์ง ์ข์ ์๋ฒ ๋ฉ์ ์ธ์๋ก ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ข์์ง
- ์ ์ด ํ์ต ๋ชจ๋ธ๋ ๋ง์ฐฌ๊ฐ์ง๋ก 0๋ถํฐ ์์ํ์ง ์์
- ๋๊ท๋ชจ ๋ง๋ญ์น๋ฅผ ํ์ฉํด์ ๋ฏธ๋ฆฌ ์๋ฒ ๋ฉ์ ๋ง๋ค์ด ๋๊ณ , ์ด ์๋ฒ ๋ฉ์ ์ ๋ ฅ๊ฐ์ผ๋ก ์ฐ๋ ์ ์ด ํ์ต ๋ชจ๋ธ์ ๋ฌธ์ ๋ถ๋ฅ๊ฐ์ ํ์คํฌ๋ฅผ ๋น ๋ฅด๊ฒ ์ํ ์ ์๊ฒ ๋จ
- ์๋ฒ ๋ฉ ํ์ง์ด ์ข์์๋ก ์ํํ๋ ค๋ ํ์คํฌ์ ์ฑ๋ฅ์ด ์ฌ๋ผ๊ฐ๊ณ , ํ์ต์์ค๋ ์ ๊ณ ๋น ๋ฅด๊ฒ ๊ฐ์ํ์ฌ ๋ชจ๋ธ์ ์๋ ด์ด ๋นจ๋ผ์ง
'AI' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
LoRA, QLoRA, LoRA-FA ๋ถ์ (0) | 2024.11.18 |
---|---|
Continue Extension์ ํ์ฉํ AI Coding ํ๊ฐ (2) | 2024.10.21 |
Prompt๋ ? (feat. LLM) (0) | 2024.08.28 |
LLM / LangChain / Fine-Tuning (1) | 2024.08.26 |
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ (0) | 2023.05.09 |