Junwei Liao

Junwei (Jaden) Liao
jwliao dot ai at {gmail dot com, sjtu dot edu dot cn}

I just graduated with a degree of B.E. in Artificial Intelligence from Xi'an Jiaotong University and was once a visiting student at University of California, Berkeley 2023 Fall. I am currently a PhD student at Shanghai Jiao Tong University under the supervision of Weinan Zhang.

I am interested in Multi-Agent Reinforcement Fine-Tuning, Reinforcement Learning, Large Decision Models, specifically LLM-based Agents and unleashing the full potential of Agents through RL and other advanced techniques.

Email / Google Scholar / GitHub

Education

Sep. 2021 ~ Jun. 2025: B.E. in Artificial Intelligence at Xi'an Jiaotong University.
Aug. 2023 ~ Dec. 2023: Visiting Student at University of California, Berkeley.

Research Experience

May. 2024 ~ Sep. 2025: RA at Shanghai Jiao Tong University, advised by Weinan Zhang.

Focus on Multi-Agent Reinforcement Fine-Tuning, Deep Reinforcement Learning, Large Decision/Action Models and Agent Technology.

Sep. 2023 ~ Mar. 2024: RA at Tsinghua University, advised by Ju Ren.

Focus on Deep Reinforcement Learning and RLHF/RLAIF.

Publications

Position: Agentic AI Is a Foreseeable Pathway to AGI
Junwei Liao, Shuai Li, Muning Wen, Jun Wang, Weinan Zhang
The Forty-Third International Conference on Machine Learning (ICML), 2026, Position Paper
OpenReview

Robust Function-Calling for On-Device Language Model via Function Masking
Qiqiang Lin*, Muning Wen*, Qiuying Peng*, Guanyu Nie, Junwei Liao, Jun Wang, Xiaoyun Mo, Jiamu Zhou, Cheng Cheng, Yin Zhao, Jun Wang, Weinan Zhang
The Thirteenth International Conference on Learning Representations (ICLR), 2025 (Spotlight)
OpenReview / arXiv / code / html / dataset and models

Preprints

MemQ: Integrating Q-Learning into Self-Evolving Memory Agents over Provenance DAGs
Junwei Liao, Haoting Shi, Ruiwen Zhou, Jiaqian Wang, Shengtao Zhang, Wei Zhang, Ying Wen, Zhiyu Li, Feiyu Xiong, Bo Tang, Weinan Zhang, Muning Wen
arXiv, 2026
arXiv / code

MemRL: Self-Evolving Agents via Runtime Reinforcement Learning on Episodic Memory
Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, Junwei Liao, Yuchen Feng, Weinan Zhang, Ying Wen, Zhiyu Li, Feiyu Xiong, Yutao Qi, Bo Tang, Muning Wen
arXiv / code

A Survey of AI Agent Protocols
Yingxuan Yang, Huacan Chai, Yuanyi Song, Siyuan Qi, Muning Wen, Ning Li, Junwei Liao, Haoyi Hu, Jianghao Lin, Gaowei Chang, Weiwen Liu, Ying Wen, Yong Yu, Weinan Zhang
arXiv / code

MARFT: Multi-Agent Reinforcement Fine-Tuning
Junwei Liao, Muning Wen, Jun Wang, Weinan Zhang
arXiv / code

Agentic IR: Agentic Information Retrieval
Weinan Zhang, Junwei Liao, Ning Li, Kounianhua Du, Jianghao Lin
arXiv / html

Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement
Muning Wen*, Junwei Liao*, Cheng Deng, Jun Wang, Weinan Zhang, Ying Wen
arXiv / code / html

Last Updated: May. 12, 2026

This guy makes a nice webpage.