🚀 Non-Standard Reinforcement Learning for Prioritized Multi-Objective Problems: lunarlander

Authors: Daniel Namaki, Niccolò Settimelli
Course: Symbolic and Evolutionary Artificial Intelligence
Academic Year: 2024/2025 – University of Pisa

🧠 Project Overview

This project investigates non-standard reinforcement learning (RL) methods that leverage lexicographic reward prioritization on the classic LunarLander-v2 environment. Instead of a single scalar reward, our agents optimize a vector reward with strict priorities:

✅ Survival (avoid crashing)
🎯 Landing quality (upright, centered touchdown)
⛽ Fuel efficiency

We implement and compare:

Potential-Based Survival Shaping
Cone-Aware Survival Shaping
Curriculum Learning with Prioritized Replay
Standard DQN Baselines

🗂 Repository Structure

2025_SEAI_F01/
├── models/                             # Saved model checkpoints
├── networks/                           # LexQNetwork & standard Q-network code
├── v_cone/                             # Cone-aware shaping agent
├── v_potential_shaping/                # Potential-based shaping agent
├── v_prioritized_curriculum_learning/  # Curriculum + prioritized replay agent
├── v_standard/                         # Standard & prioritized DQN agents
├── requirements.txt                    # Python dependencies
├── doc_seai_f01.pdf                    # Full project report
└── README.md                           # This overview

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🚀 Non-Standard Reinforcement Learning for Prioritized Multi-Objective Problems: lunarlander

🧠 Project Overview

🗂 Repository Structure

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
models		models
networks		networks
v_cone		v_cone
v_potential_shaping		v_potential_shaping
v_prioritized_curriculum_learning		v_prioritized_curriculum_learning
v_standard		v_standard
.gitignore		.gitignore
README.md		README.md
documentation.pdf		documentation.pdf
requirements.txt		requirements.txt

NamaWho/lex-lunarlander

Folders and files

Latest commit

History

Repository files navigation

🚀 Non-Standard Reinforcement Learning for Prioritized Multi-Objective Problems: lunarlander

🧠 Project Overview

🗂 Repository Structure

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages