jianbo dai's picture

8

jianbo dai

jbd

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Probability-Entropy Calibration: An Elastic Indicator for Adaptive Fine-tuning

upvoted a paper 3 days ago

Improving Data and Reward Design for Scientific Reasoning in Large Language Models

upvoted a paper 5 days ago

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

View all activity

Organizations

upvoted a paper 2 days ago

Probability-Entropy Calibration: An Elastic Indicator for Adaptive Fine-tuning

Paper • 2602.01745 • Published 12 days ago • 7

upvoted a paper 3 days ago

Improving Data and Reward Design for Scientific Reasoning in Large Language Models

Paper • 2602.08321 • Published 5 days ago • 39

upvoted a paper 5 days ago

MSign: An Optimizer Preventing Training Instability in Large Language Models via Stable Rank Restoration

Paper • 2602.01734 • Published 12 days ago • 32

upvoted a paper about 1 month ago

SWE-Lego: Pushing the Limits of Supervised Fine-tuning for Software Issue Resolving

Paper • 2601.01426 • Published Jan 4 • 24

upvoted 2 papers 6 months ago

Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR

Paper • 2508.14029 • Published Aug 19, 2025 • 118

MHPP: Exploring the Capabilities and Limitations of Language Models Beyond Basic Code Generation

Paper • 2405.11430 • Published May 19, 2024 • 2

upvoted a paper 12 months ago

FINEREASON: Evaluating and Improving LLMs' Deliberate Reasoning through Reflective Puzzle Solving

Paper • 2502.20238 • Published Feb 27, 2025 • 23

upvoted a paper over 1 year ago

Personalized Visual Instruction Tuning

Paper • 2410.07113 • Published Oct 9, 2024 • 70