LLM Training

рдпреЗ рдореЗрд░реА рдиреЛрдЯреНрд╕ рд╣реИрдВ рдмрд╣реБрдд рд╣реА рдЕрдиреБрд╢рдВрд╕рд┐рдд рдХрд┐рддрд╛рдм рд╕реЗ https://www.manning.com/books/build-a-large-language-model-from-scratch рдХреБрдЫ рдЕрддрд┐рд░рд┐рдХреНрдд рдЬрд╛рдирдХрд╛рд░реА рдХреЗ рд╕рд╛рдеред

Basic Information

рдЖрдкрдХреЛ рдХреБрдЫ рдмреБрдирд┐рдпрд╛рджреА рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЬрд╛рдирдиреЗ рдХреЗ рд▓рд┐рдП рдЗрд╕ рдкреЛрд╕реНрдЯ рдХреЛ рдкрдврд╝рдирд╛ рдЪрд╛рд╣рд┐рдП:

0. Basic LLM Concepts

1. Tokenization

рдЗрд╕ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЪрд░рдг рдХрд╛ рд▓рдХреНрд╖реНрдп рдмрд╣реБрдд рд╕рд░рд▓ рд╣реИ: рдЗрдирдкреБрдЯ рдХреЛ рдХреБрдЫ рдЗрд╕ рддрд░рд╣ рд╕реЗ рдЯреЛрдХрди (ids) рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░реЗрдВ рдЬреЛ рд╕рдордЭ рдореЗрдВ рдЖрдПред

1. Tokenizing

2. Data Sampling

рдЗрд╕ рджреВрд╕рд░реЗ рдЪрд░рдг рдХрд╛ рд▓рдХреНрд╖реНрдп рдмрд╣реБрдд рд╕рд░рд▓ рд╣реИ: рдЗрдирдкреБрдЯ рдбреЗрдЯрд╛ рдХрд╛ рд╕реИрдВрдкрд▓ рд▓реЗрдВ рдФрд░ рдЗрд╕реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдЪрд░рдг рдХреЗ рд▓рд┐рдП рддреИрдпрд╛рд░ рдХрд░реЗрдВ, рдЖрдорддреМрд░ рдкрд░ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЛ рдПрдХ рд╡рд┐рд╢рд┐рд╖реНрдЯ рд▓рдВрдмрд╛рдИ рдХреЗ рд╡рд╛рдХреНрдпреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рдХреЗ рдФрд░ рдЕрдкреЗрдХреНрд╖рд┐рдд рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рднреА рдЙрддреНрдкрдиреНрди рдХрд░рдХреЗред

https://github.com/HackTricks-wiki/hacktricks/blob/in/todo/llm-training-data-preparation/2.-data-sampling.md

3. Token Embeddings

рдЗрд╕ рддреАрд╕рд░реЗ рдЪрд░рдг рдХрд╛ рд▓рдХреНрд╖реНрдп рдмрд╣реБрдд рд╕рд░рд▓ рд╣реИ: рд╢рдмреНрджрдХреЛрд╢ рдореЗрдВ рдкрд┐рдЫрд▓реЗ рдЯреЛрдХрдиреЛрдВ рдореЗрдВ рд╕реЗ рдкреНрд░рддреНрдпреЗрдХ рдХреЛ рдореЙрдбрд▓ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрдЪреНрдЫрд┐рдд рдЖрдпрд╛рдореЛрдВ рдХрд╛ рдПрдХ рд╡реЗрдХреНрдЯрд░ рд╕реМрдВрдкреЗрдВред рд╢рдмреНрджрдХреЛрд╢ рдореЗрдВ рдкреНрд░рддреНрдпреЗрдХ рд╢рдмреНрдж X рдЖрдпрд╛рдореЛрдВ рдХреЗ рдПрдХ рд╕реНрдерд╛рди рдореЗрдВ рдПрдХ рдмрд┐рдВрджреБ рд╣реЛрдЧрд╛ред рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдкреНрд░рд╛рд░рдВрдн рдореЗрдВ рдкреНрд░рддреНрдпреЗрдХ рд╢рдмреНрдж рдХрд╛ рд╕реНрдерд╛рди "рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рд░реВрдк рд╕реЗ" рдкреНрд░рд╛рд░рдВрдн рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рдФрд░ рдпреЗ рд╕реНрдерд╛рди рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдпреЛрдЧреНрдп рдкреИрд░рд╛рдореАрдЯрд░ рд╣реИрдВ (рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рджреМрд░рд╛рди рд╕реБрдзрд╛рд░рд┐рдд рд╣реЛрдВрдЧреЗ)ред

рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рдЯреЛрдХрди рдПрдореНрдмреЗрдбрд┐рдВрдЧ рдХреЗ рджреМрд░рд╛рди рдПрдХ рдФрд░ рдПрдореНрдмреЗрдбрд┐рдВрдЧ рдкрд░рдд рдмрдирд╛рдИ рдЬрд╛рддреА рд╣реИ рдЬреЛ (рдЗрд╕ рдорд╛рдорд▓реЗ рдореЗрдВ) рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╡рд╛рдХреНрдп рдореЗрдВ рд╢рдмреНрдж рдХреА рд╕рдЯреАрдХ рд╕реНрдерд┐рддрд┐ рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рддреА рд╣реИред рдЗрд╕ рддрд░рд╣, рд╡рд╛рдХреНрдп рдореЗрдВ рд╡рд┐рднрд┐рдиреНрди рд╕реНрдерд╛рдиреЛрдВ рдкрд░ рдПрдХ рд╢рдмреНрдж рдХрд╛ рдПрдХ рдЕрд▓рдЧ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ (рдЕрд░реНрде) рд╣реЛрдЧрд╛ред

3. Token Embeddings

4. Attention Mechanisms

рдЗрд╕ рдЪреМрдереЗ рдЪрд░рдг рдХрд╛ рд▓рдХреНрд╖реНрдп рдмрд╣реБрдд рд╕рд░рд▓ рд╣реИ: рдХреБрдЫ рдзреНрдпрд╛рди рддрдВрддреНрд░ рд▓рд╛рдЧреВ рдХрд░реЗрдВред рдпреЗ рдмрд╣реБрдд рд╕рд╛рд░реЗ рджреЛрд╣рд░рд╛рдП рдЬрд╛рдиреЗ рд╡рд╛рд▓реЗ рдкрд░рддреЗрдВ рд╣реЛрдВрдЧреА рдЬреЛ рд╢рдмреНрджрдХреЛрд╢ рдореЗрдВ рдПрдХ рд╢рдмреНрдж рдХреЗ рдкрдбрд╝реЛрд╕рд┐рдпреЛрдВ рдХреЗ рд╕рд╛рде рд╡рд░реНрддрдорд╛рди рд╡рд╛рдХреНрдп рдореЗрдВ рд╕рдВрдмрдВрдз рдХреЛ рдХреИрдкреНрдЪрд░ рдХрд░реЗрдВрдЧреА рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ LLM рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИред рдЗрд╕рдХреЗ рд▓рд┐рдП рдмрд╣реБрдд рд╕рд╛рд░реА рдкрд░рддреЗрдВ рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рддреА рд╣реИрдВ, рдЗрд╕рд▓рд┐рдП рдмрд╣реБрдд рд╕рд╛рд░реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдпреЛрдЧреНрдп рдкреИрд░рд╛рдореАрдЯрд░ рдЗрд╕ рдЬрд╛рдирдХрд╛рд░реА рдХреЛ рдХреИрдкреНрдЪрд░ рдХрд░реЗрдВрдЧреЗред

4. Attention Mechanisms

5. LLM Architecture

рдЗрд╕ рдкрд╛рдВрдЪрд╡реЗ рдЪрд░рдг рдХрд╛ рд▓рдХреНрд╖реНрдп рдмрд╣реБрдд рд╕рд░рд▓ рд╣реИ: рдкреВрд░реНрдг LLM рдХреА рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рд╡рд┐рдХрд╕рд┐рдд рдХрд░реЗрдВред рд╕рдм рдХреБрдЫ рдПрдХ рд╕рд╛рде рд░рдЦреЗрдВ, рд╕рднреА рдкрд░рддреЗрдВ рд▓рд╛рдЧреВ рдХрд░реЗрдВ рдФрд░ рдкрд╛рда рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдпрд╛ рдкрд╛рда рдХреЛ IDs рдореЗрдВ рдФрд░ рдЗрд╕рдХреЗ рд╡рд┐рдкрд░реАрдд рдкрд░рд┐рд╡рд░реНрддрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рднреА рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рдмрдирд╛рдПрдВред

рдпрд╣ рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рджреЛрдиреЛрдВ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛, рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдФрд░ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХреЗ рд▓рд┐рдП рдкрд╛рда рдХреЗ рдмрд╛рдж рдЗрд╕реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ред

5. LLM Architecture

6. Pre-training & Loading models

рдЗрд╕ рдЫрдареЗ рдЪрд░рдг рдХрд╛ рд▓рдХреНрд╖реНрдп рдмрд╣реБрдд рд╕рд░рд▓ рд╣реИ: рдореЙрдбрд▓ рдХреЛ рд╢реВрдиреНрдп рд╕реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░реЗрдВред рдЗрд╕рдХреЗ рд▓рд┐рдП рдкрд┐рдЫрд▓реЗ LLM рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ рдЬрд┐рд╕рдореЗрдВ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдкрд░ рдкрд░рд┐рднрд╛рд╖рд┐рдд рд╣рд╛рдирд┐ рдХрд╛рд░реНрдпреЛрдВ рдФрд░ рдСрдкреНрдЯрд┐рдорд╛рдЗрдЬрд╝рд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реБрдП рд▓реВрдк рд╣реЛрдВрдЧреЗ рддрд╛рдХрд┐ рдореЙрдбрд▓ рдХреЗ рд╕рднреА рдкреИрд░рд╛рдореАрдЯрд░ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХреЗред

https://github.com/HackTricks-wiki/hacktricks/blob/in/todo/llm-training-data-preparation/6.-pre-training-and-loading-models.md

7.0. LoRA Improvements in fine-tuning

LoRA рдХрд╛ рдЙрдкрдпреЛрдЧ рдкрд╣рд▓реЗ рд╕реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдореЙрдбрд▓реЛрдВ рдХреЛ fine tune рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рдЧрдгрдирд╛ рдХреЛ рдмрд╣реБрдд рдХрдо рдХрд░рддрд╛ рд╣реИред

7.0. LoRA Improvements in fine-tuning

7.1. Fine-Tuning for Classification

рдЗрд╕ рдЕрдиреБрднрд╛рдЧ рдХрд╛ рд▓рдХреНрд╖реНрдп рдпрд╣ рджрд┐рдЦрд╛рдирд╛ рд╣реИ рдХрд┐ рдкрд╣рд▓реЗ рд╕реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдореЙрдбрд▓ рдХреЛ рдХреИрд╕реЗ fine-tune рдХрд┐рдпрд╛ рдЬрд╛рдП рддрд╛рдХрд┐ рдирдпрд╛ рдкрд╛рда рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдХреЗ рдмрдЬрд╛рдп LLM рдкреНрд░рддреНрдпреЗрдХ рджрд┐рдП рдЧрдП рд╢реНрд░реЗрдгреА рдореЗрдВ рд╡рд░реНрдЧреАрдХреГрдд рд╣реЛрдиреЗ рдХреЗ рд▓рд┐рдП рджрд┐рдП рдЧрдП рдкрд╛рда рдХреА рд╕рдВрднрд╛рд╡рдирд╛рдПрдБ рдкреНрд░рджрд╛рди рдХрд░реЗ (рдЬреИрд╕реЗ рдХрд┐ рдХреЛрдИ рдкрд╛рда рд╕реНрдкреИрдо рд╣реИ рдпрд╛ рдирд╣реАрдВ)ред

https://github.com/HackTricks-wiki/hacktricks/blob/in/todo/llm-training-data-preparation/7.1.-fine-tuning-for-classification.md

7.2. Fine-Tuning to follow instructions

рдЗрд╕ рдЕрдиреБрднрд╛рдЧ рдХрд╛ рд▓рдХреНрд╖реНрдп рдпрд╣ рджрд┐рдЦрд╛рдирд╛ рд╣реИ рдХрд┐ рдкрд╣рд▓реЗ рд╕реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдореЙрдбрд▓ рдХреЛ рдирд┐рд░реНрджреЗрд╢реЛрдВ рдХрд╛ рдкрд╛рд▓рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреИрд╕реЗ fine-tune рдХрд┐рдпрд╛ рдЬрд╛рдП рди рдХрд┐ рдХреЗрд╡рд▓ рдкрд╛рда рдЙрддреНрдкрдиреНрди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдПрдХ рдЪреИрдЯ рдмреЙрдЯ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рд░реНрдпреЛрдВ рдХрд╛ рдЙрддреНрддрд░ рджреЗрдирд╛ред

7.2. Fine-Tuning to follow instructions

Last updated