very Small Language Model (vSLM)

About

A short project to implement a small GPT like model from scratch. Most of it is inspired by minBPE and nanoGPT.

python -m venv project_venv
source project_venv/bin/activate

pip install -e .
pip install -r requirements.txt

python main.py --training_iterations=5000 --text=shakespeare --train_model=False --task=generation

In coming:
- Fine-tuning (LoRA + RLHF)
- (TODO) Provide good training parameters fo translation
Done:
- Tokenizer (byte and character level)
- Full Transformer architecture (Encoder + Decoder)
- Training and inference pipeline for generation (Lorem Ipsum and Shakespeare)
- Training and inference pipeline for translation (en → fr)

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
data		data
model		model
tokenizers		tokenizers
weights		weights
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
Readme.md		Readme.md
main.py		main.py
requirements.txt		requirements.txt
setup.py		setup.py