YUXIN WANG's picture

14 1

YUXIN WANG PRO

yuxinhk

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 14 hours ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

View all activity

Organizations

upvoted a paper about 14 hours ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 1 day ago • 91