Оригинальные искодные коды:
https://github.com/rasbt/LLMs-from-scratch
- ✅ Знакомство с большими языковыми моделями
- ✅ Работа с текстовыми данными
- Программирование механизмов внимания
- Создание GPT-подобной модели для генерации текста с нуля
- Предварительное обучение на неразмеченных данных
- Тонкая настройка по классификации
- Тонкая настройка по инструкциям
$ mkdir -p ~/projects/dev/ml/llm
$ cd ~/projects/dev/ml/llm
$ git clone https://github.com/webmakaka/Build-a-Large-Language-Model-From-Scratch
$ cd Build-a-Large-Language-Model-From-Scratch/$ pip install uv
$ uv venv --python=python3.12
$ source .venv/bin/activate
$ uv pip install -r requirements.txt
$ uv run jupyter lab

