ํฐ์คํ ๋ฆฌ ๋ทฐ
ใ ๊ต์ : ์์ธ๋ํ๊ต ๊น๊ฑดํฌ
ใ ํ์ต๋ชฉํ : ๋ณธ ๋ชจ๋์ Machine Learning์ ๊ธฐ๋ณธ ๊ฐ๋ ์ ๋ํ ํ์ต ๊ณผ์ ์ ๋๋ค. ML์ด๋ ๋ฌด์์ธ์ง, Overfitting๊ณผ Underfitting์ ๊ฐ๋ , ์ต๊ทผ ๋ง์ ๊ด์ฌ์ ๋ฐ๊ณ ์๋ ์ด๊ฑฐ๋ ์ธ์ด๋ชจ๋ธ์ ๋ํด ํ์ตํ๊ฒ ๋ฉ๋๋ค.
Part 1. Introduction to Machine Learning
- ๊ธฐ๊ณํ์ต : ์ธ๊ณต์ง๋ฅ์ ํ ๋ถ์ผ (์ธ๊ณต์ง๋ฅ-๊ธฐ๊ณํ์ต-๋ฅ๋ฌ๋: ๊ธฐ๊ณํ์ต ์ค ์ ๊ฒฝ๋ง ๋ ์ด์ด๊ฐ ๋ง์ ๋ถ์ผ)
- ํ๋ฒํธ ์ฌ์ด๋จผ : ์์ฌ๊ฒฐ์ ์ ๊ด๋ จ๋ ์ฐ๊ตฌ / ์์ ์ฌ๋ฌด์ : Game Tree ์ํ-๋ฒ ํ prunning, ์ฒด์คํ๋ก๊ทธ๋จ
- Tom Mitchell's definition : Task(์ด๋ค ์์ ), Performance Measure(์ฑ๋ฅ ์งํ), Experience(Data)
Part 2. Bias and Variance
- ํธํฅ / ๋ถ์ฐ
- ๊ธฐ๊ณํ์ต์์๋ ํ์ต๋ฐ์ดํฐ๋ฅผ ๋ชจ์ผ๊ฒ ๋จ -> x, y ์ -> ex) linear ํจ์ ์ ์ฉ -> ์ ๋์ํ๋ w์ b๋ฅผ ์ฐพ๋ ์ผ์ด๋จ
- Loss Function : ๋ชจ๋ธ์ ์์ธก๊ฐ๊ณผ ์ ๋ต๊ฐ์ด ํ๋ฆฌ๋ฉด ํ๋ฆด์๋ก ๊ฐ์ด ์ปค์ง๋ ํจ์
- New unseen data์ ๋ํด ์ฑ๋ฅ์ด ์ข์์ผํจ (์ผ๋ฐํ ๋ฅ๋ ฅ)
- Overfitting ๊ณผ์ ํฉ -> ์ผ๋จ ์ค๋ฒํผํ ์์ผ์ ํธ๋ ์ด๋ ์๋ฌ๋ฅผ ์ค์ด๋ ๊ฒ ๋์
- Underfitting ๊ณผ์์ ํฉ -> ์ด๊ฑด ์ ์ด์ ๋๋ฉด ์๋๋ ๊ฒ์, ๋ชจ๋ธ์ ์๋ชป ์ ํ ํ๊ฑฐ๋ or ๋ฐ์ดํฐ๋ฅผ ์๋ชป ํ์ต์ํด
- Model's Capacity : ์ ํ ํจ์ 2์ฐจํจ์ ๋ฑ๋ฑ -> "์ค์ปด์ ๋ฉด๋๋ " : ํ๋ฅ ์ ์ผ๋ก ๊ฐ๋จํ ์ค๋ช ์ด ์ณ์ ํ๋ฅ ์ด ๋๋ค
- Regularization ์ ๊ทํ : ๋ชฉ์ ํจ์๋ loss๊ฐ ์ต์๋๋๋ก ๋์ด์์ -> ๊ณผ์ ํฉ ๋น ์ง ์ ์๊ธฐ ๋๋ฌธ์ Term์ ๋ณด์์ผ๋ก ์ถ๊ฐํ๊ฒ๋จ. -> ๋ชจ๋ธ capacitiy๋ ์ต์ํ๋๋ก. -> Hyperparameter (lambda)๋ฅผ ํตํด ์ผ๋ฐํ ์๋ฌ๋ฅผ ๋ฎ์ถ๋ ๊ฒ์ด ๋ชฉํ (ํธ๋ ์ด๋ ์๋ฌ๋ฅผ ๋ฎ์ถ๊ฒ ๋ค๋ ๊ฒ์ด ์๋. ํธ๋ ์ด๋ ์๋ฌ๋ฅผ ํฌ์ํ๊ณ ์ผ๋ฐํ ์๋ฌ๋ฅผ ๋ฎ์ถ๊ฒ ๋ค.)
- Bias(์์ธก๊ณผ ์ค์ ๊ฐ๊ณผ ์ฐจ์ด) / Variance ๋๋ค ๋ฎ์์ผํจ but ๋ ์ฌ์ด์๋ trade off๊ฐ ์กด์ฌ. (๋ฐ๋น๋ก) -> ๋๋ค ๋ฎ์ถ๊ธฐ ์ํด ์์๋ธ learning์ด ํ์ฉ๋จ.
Part 3. Recent Progress of Large Language Models
- ์ด์ ์๋ ํ๋์ task์ ์ง์ค๋ ์ธ๊ณต์ง๋ฅ์ด ๋ง์์ (ex ๋ฒ์ญ, ์์ฝ)
- but GPT๋ ์ผ๋ฐ ์ธ๊ณต์ง๋ฅ์ ์ง์ค์ ํ๊ฒ ๋ค -> ๊ฑฐ์ง๋ง์ ํด์๋ผ๋ ์๋ต์ ๋
- InstructGPT (GPT3.5)๊ฐ ์ค์ํ ๋ชจ๋ธ์ -> ์ฌ์ฉ์์ ์ง์๋ฅผ ์ ์ฉํ๋ฉด์๋ ์์ ํ๊ฒ ์๋ต์ ์์ฑํ ์ ์๊ฒ ํ์ต๋จ.-> GPT3์์ GPT3.5๋ก ๋ณํ ํต์ฌ๊ธฐ๋ฅ์ด RLHF์ -> ๊ฐํํ์ต์ธ๋ฐ, ์ฌ๋์ ํผ๋๋ฐฑ์ ์ด์ฉํด์ ํ์ต์ ํ๊ฒ ๋ค.
- Training of InstructGPT :
1. Supervised fine-tuning(SFT) ์ง๋ํ์ต ์ํด
2. Reward model(RM) training : GPT์๊ฒ ์ฌ๋ฌ๊ฐ์ ์๋ต์ ์์ฑํ๊ฒ ํ๊ณ ์ฌ๋์ด ์ด ์๋ต์ ๋ญํน์ ๋งค๊น -> ๋ญํน์ค์ฝ์ด๋ฅผ ์์ธกํ๋๋ก ๋ชจ๋ธ์ ํ์ต
3. RL via PPO : ์ง๋ฌธ๊ณผ ์๋ต์ด ์ฃผ์ด์ง๋ฉด RM์ ์ค์ฝ์ด๋ฅผ ์์ธก์์ฑํ๊ณ , ์ด ์ค์ฝ์ด๋ฅผ ๊ฐํํ์ต์ ๋ณด์์ผ๋ก ํ์ฉํด์ instructGPT ํ์ตํจ. (PPO๋ openAI์ฌ์์ ๋ง๋ ์ ๋ช ํ ๊ฐํํ์ต ์๊ณ ๋ฆฌ์ฆ)
- ChatGPT๋ GPT์ ๋ํ user์ธํฐํ์ด์ค๋ฅผ ๋ถ์ธ ๊ฒ
- GPT4๋ ๋๊ฐ์ง๋ฅผ ๊ฐ์กฐํจ
1. large multimodal (ํ ์คํธ, ์ฌ์ง, ์ด๋ชจํฐ์ฝ ๋ฑ ๋ค์ํ ๋ชจ๋ฌ๋ฆฌํฐ)
2. No technical details (๊ธฐ์ ์ ์ธ ๋ํ ์ผ์ ์๋ฌด๊ฒ๋ ๊ณต๊ฐํ์ง ์์) , contect length์ ๋น ๋ฅธ์ฆ๊ฐ
- Google Bard
- ๊ตฌ๊ธ PaLM
-Meta OPT & LLaMA(์ธ์ด๋ชจ๋ธ) : ์ ์ฒด๊ณต๊ฐ -> Self-Instruct Tuning(gpt์ ์ฌ๋์ด ์ง์- gpt๊ฐ ์๋ตํ data ์์ ์ด์ฉํด์ ๋ผ๋ง๋ฅผ ํ์ต์ ์ํด)
- VIcuna-13B๋ชจ๋ธ์ ๊ทธ๋ ๊ฒ ๊ฐ๋ฐํจ(๋๋ ์๋ค์ด๊ณ ) -> ๋ผ๋ง์ ์์์ด ๊ฐ๋ง์
'๋์ธํ๋ > LG Aimers' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Module 5. ์ธ๊ณผ์ถ๋ก (0) | 2024.01.14 |
---|---|
Module 4. ์ง๋ํ์ต(๋ถ๋ฅ/ํ๊ท) (1) | 2024.01.13 |
Module 2. Mathematics for ML (0) | 2024.01.09 |
Module 1. AI ์ค๋ฆฌ (0) | 2024.01.05 |
- Total
- Today
- Yesterday
- C์ธ์ด
- 3d-gs
- SQL
- Gaussian Splatting
- gan
- ์ฝ๋ฉ์๋ฌ
- AI์ปจํผ๋ฐ์ค
- Paper review
- gs๋ ผ๋ฌธ
- ๋ ผ๋ฌธ๋ฆฌ๋ทฐ
- AIRUSH
- AIRUSH2023
- ๋ ผ๋ฌธ
- dreambooth
- Aimers
- lgaimers
- ๋ ผ๋ฌธ์ฝ๊ธฐ
- ์ปดํจํฐ๋น์
- ํ ํฌ์๋ฐ
- ์ฝํ ์ค๋น
- ์ฝ๋ฉ๊ณต๋ถ
- ํ์ด์ฌ
- MYSQL
- ๋๋ฆผ๋ถ์ค
- ํ๋ก๊ทธ๋๋จธ์ค
- CLOVAX
- 2d-gs
- SKTECHSUMMIT
- ํ์ด์ฌ์ฝํ
- ์คํ ์ด๋ธ๋ํจ์
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |