LLM Training
์ด๊ฒ์ ๋งค์ฐ ์ถ์ฒํ๋ ์ฑ https://www.manning.com/books/build-a-large-language-model-from-scratch ์์์ ๋ด ๋ ธํธ์ ์ถ๊ฐ ์ ๋ณด์ ๋๋ค.
Basic Information
์ด ํฌ์คํธ๋ฅผ ์ฝ๋ ๊ฒ์ผ๋ก ์์ํด์ผ ํฉ๋๋ค. ์์์ผ ํ ๊ธฐ๋ณธ ๊ฐ๋ ์ ๋ํด ์ค๋ช ํฉ๋๋ค:
0. Basic LLM Concepts1. Tokenization
์ด ์ด๊ธฐ ๋จ๊ณ์ ๋ชฉํ๋ ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค: ์ ๋ ฅ์ ์๋ฏธ ์๋ ๋ฐฉ์์ผ๋ก ํ ํฐ(์์ด๋)์ผ๋ก ๋๋๋ ๊ฒ์ ๋๋ค.
2. Data Sampling
์ด ๋ ๋ฒ์งธ ๋จ๊ณ์ ๋ชฉํ๋ ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค: ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ํ๋งํ๊ณ ํ๋ จ ๋จ๊ณ์ ๋ง๊ฒ ์ค๋นํ๋ ๊ฒ์ ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ๋ฐ์ดํฐ์ ์ ํน์ ๊ธธ์ด์ ๋ฌธ์ฅ์ผ๋ก ๋๋๊ณ ์์ ์๋ต๋ ์์ฑํฉ๋๋ค.
3. Token Embeddings
์ด ์ธ ๋ฒ์งธ ๋จ๊ณ์ ๋ชฉํ๋ ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค: ์ดํ์ ๊ฐ ์ด์ ํ ํฐ์ ์ํ๋ ์ฐจ์์ ๋ฒกํฐ๋ฅผ ํ ๋นํ์ฌ ๋ชจ๋ธ์ ํ๋ จํ๋ ๊ฒ์ ๋๋ค. ์ดํ์ ๊ฐ ๋จ์ด๋ X ์ฐจ์์ ๊ณต๊ฐ์์ ํ ์ ์ด ๋ฉ๋๋ค. ๊ฐ ๋จ์ด์ ์ด๊ธฐ ์์น๋ "๋ฌด์์๋ก" ์ด๊ธฐํ๋๋ฉฐ, ์ด๋ฌํ ์์น๋ ํ๋ จ ๊ฐ๋ฅํ ๋งค๊ฐ๋ณ์์ ๋๋ค(ํ๋ จ ์ค ๊ฐ์ ๋ฉ๋๋ค).
๋ํ, ํ ํฐ ์๋ฒ ๋ฉ ๋์ ๋ค๋ฅธ ์๋ฒ ๋ฉ ๋ ์ด์ด๊ฐ ์์ฑ๋ฉ๋๋ค. ์ด๋ (์ด ๊ฒฝ์ฐ) ํ๋ จ ๋ฌธ์ฅ์์ ๋จ์ด์ ์ ๋ ์์น๋ฅผ ๋ํ๋ ๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ๋ฌธ์ฅ์์ ์๋ก ๋ค๋ฅธ ์์น์ ์๋ ๋จ์ด๋ ์๋ก ๋ค๋ฅธ ํํ(์๋ฏธ)์ ๊ฐ๊ฒ ๋ฉ๋๋ค.
4. Attention Mechanisms
์ด ๋ค ๋ฒ์งธ ๋จ๊ณ์ ๋ชฉํ๋ ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค: ์ผ๋ถ ์ฃผ์ ๋ฉ์ปค๋์ฆ์ ์ ์ฉํ๋ ๊ฒ์ ๋๋ค. ์ด๋ ์ดํ์ ๋จ์ด์ ํ์ฌ ๋ฌธ์ฅ์์์ ์ด์ ๊ฐ์ ๊ด๊ณ๋ฅผ ํฌ์ฐฉํ๋ ๋ง์ ๋ฐ๋ณต ๋ ์ด์ด๊ฐ ๋ ๊ฒ์ ๋๋ค. ์ด๋ฅผ ์ํด ๋ง์ ๋ ์ด์ด๊ฐ ์ฌ์ฉ๋๋ฉฐ, ๋ง์ ํ๋ จ ๊ฐ๋ฅํ ๋งค๊ฐ๋ณ์๊ฐ ์ด ์ ๋ณด๋ฅผ ํฌ์ฐฉํ๊ฒ ๋ฉ๋๋ค.
5. LLM Architecture
์ด ๋ค์ฏ ๋ฒ์งธ ๋จ๊ณ์ ๋ชฉํ๋ ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค: ์ ์ฒด LLM์ ์ํคํ ์ฒ๋ฅผ ๊ฐ๋ฐํ๋ ๊ฒ์ ๋๋ค. ๋ชจ๋ ๊ฒ์ ํตํฉํ๊ณ , ๋ชจ๋ ๋ ์ด์ด๋ฅผ ์ ์ฉํ๋ฉฐ, ํ ์คํธ๋ฅผ ์์ฑํ๊ฑฐ๋ ํ ์คํธ๋ฅผ ID๋ก ๋ณํํ๊ณ ๊ทธ ๋ฐ๋๋ก ๋ณํํ๋ ๋ชจ๋ ๊ธฐ๋ฅ์ ์์ฑํฉ๋๋ค.
์ด ์ํคํ ์ฒ๋ ํ๋ จ ํ ํ ์คํธ๋ฅผ ์์ธกํ๋ ๋ฐ์๋ ์ฌ์ฉ๋ฉ๋๋ค.
6. Pre-training & Loading models
์ด ์ฌ์ฏ ๋ฒ์งธ ๋จ๊ณ์ ๋ชฉํ๋ ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค: ๋ชจ๋ธ์ ์ฒ์๋ถํฐ ํ๋ จํ๋ ๊ฒ์ ๋๋ค. ์ด๋ฅผ ์ํด ์ด์ LLM ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํ์ฌ ์ ์๋ ์์ค ํจ์์ ์ต์ ํ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ์ ์ ๋ฐ๋ณตํ๋ ๋ฃจํ๋ฅผ ํตํด ๋ชจ๋ธ์ ๋ชจ๋ ๋งค๊ฐ๋ณ์๋ฅผ ํ๋ จํฉ๋๋ค.
7.0. LoRA Improvements in fine-tuning
LoRA์ ์ฌ์ฉ์ ์ด๋ฏธ ํ๋ จ๋ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ๋ฐ ํ์ํ ๊ณ์ฐ์ ๋ง์ด ์ค์ ๋๋ค.
7.1. Fine-Tuning for Classification
์ด ์น์ ์ ๋ชฉํ๋ ์ด๋ฏธ ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ฃผ๋ ๊ฒ์ ๋๋ค. ๋ฐ๋ผ์ ์๋ก์ด ํ ์คํธ๋ฅผ ์์ฑํ๋ ๋์ LLM์ ์ฃผ์ด์ง ํ ์คํธ๊ฐ ๊ฐ ์ฃผ์ด์ง ์นดํ ๊ณ ๋ฆฌ์ ๋ถ๋ฅ๋ ํ๋ฅ ์ ์ ํํฉ๋๋ค(์: ํ ์คํธ๊ฐ ์คํธ์ธ์ง ์๋์ง).
7.2. Fine-Tuning to follow instructions
์ด ์น์ ์ ๋ชฉํ๋ ํ ์คํธ๋ฅผ ์์ฑํ๋ ๊ฒ๋ฟ๋ง ์๋๋ผ ์ง์นจ์ ๋ฐ๋ฅด๋๋ก ์ด๋ฏธ ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ฃผ๋ ๊ฒ์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์ฑ๋ด์ผ๋ก์ ์์ ์ ์๋ตํ๋ ๊ฒ์ ๋๋ค.
Last updated