tongruiliu

Follow

🎯

Focusing

tongruiliu

🎯

Focusing

Follow

UBIQUANT·IQUESTLAB

14 followers · 9 following

Peking University UBIQUANT
Beijing
https://tongruiliu.github.io/

Achievements

Achievements

Pinned Loading

Guided-GRPO Guided-GRPO Public

A Guided Reinforcement Learning framework enhancing MLLM reasoning via process-level verification and collaborative rollout strategies.

Python 47
GMT GMT Public

GMT: Graph-as-Memory Tuning for deep KG–LLM fusion via cross-attention.

Python 11 1
Canvas_data_generation_pipeline Canvas_data_generation_pipeline Public

primary code

Python 1
OpenDCAI/DataFlow-MM OpenDCAI/DataFlow-MM Public

Dataflow-MM, multi-media operators for Dataflow. We aim to prepare data for Multimodal Large Language Models.

Python 34 19
tongruiliu.github.io tongruiliu.github.io Public

my page

HTML 1