Lang Feng's picture

7 3

Lang Feng

langfeng01

·

langfengQ

AI & ML interests

PhD student @ NTU Singapore

Organizations

None yet

upvoted a paper 3 months ago

The Landscape of Agentic Reinforcement Learning for LLMs: A Survey

Paper • 2509.02547 • Published Sep 2 • 225

upvoted a collection 4 months ago

Qwen3

84 items • Updated Aug 6 • 1.48k

upvoted a paper 5 months ago

TimeMaster: Training Time-Series Multimodal LLMs to Reason via Reinforcement Learning

Paper • 2506.13705 • Published Jun 16 • 2

upvoted 2 collections 6 months ago

TimeMaster

Open-source models of TimeMaster • 2 items • Updated Jul 2 • 2

verl-agent

Open-source models trained via GiGPO and verl-agent • 4 items • Updated Jun 20 • 2

upvoted 2 papers 7 months ago

Group-in-Group Policy Optimization for LLM Agent Training

Paper • 2505.10978 • Published May 16 • 18

Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models

Paper • 2505.10554 • Published May 15 • 120