使用 PPO 进行 TRex 小恐龙游戏

上面的结果仅在一张 RTX 3090 上训练了半个小时得到，PPO 的效果远超 DQN 的效果。

本项目还有许多处理不完善的地方，最终可能会遇到数值溢出。但是作为了解 PPO 的入门项目，无疑是简单而有趣的。

安装依赖项

pip install -r requirements.txt

训练

python train.py 0 False
## python train.py <id> <recover>
## id: 整数，用来标记 record 中的输出
## recover: Bool, 是否从保存的模型中恢复

模型文件输出在 models/ 目录下。

游戏记录输出在 record/ 目录下。

致谢

游戏部分基于此项目进行改编：SigureMo/T-Rex-runner-pygame: 🦖 T-rex running implemented with pygame。在其基础上关闭显示，实现了逐帧控制。

PPO 的框架改编自 Hands-on-RL，针对较长的游戏周期，实现了 mini-batch 训练。

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
fonts		fonts
images		images
sprites		sprites
.editorconfig		.editorconfig
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
agent.py		agent.py
backgroud.py		backgroud.py
events.py		events.py
gameover.py		gameover.py
model.py		model.py
requirements.txt		requirements.txt
speed.py		speed.py
train.py		train.py
trex.py		trex.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

使用 PPO 进行 TRex 小恐龙游戏

安装依赖项

训练

致谢

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

使用 PPO 进行 TRex 小恐龙游戏

安装依赖项

训练

致谢

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages