Yuexi Shen's picture

2 1

Yuexi Shen

yuexishen

AI & ML interests

None yet

Recent Activity

upvoted a paper 12 days ago

Video-R4: Reinforcing Text-Rich Video Reasoning with Visual Rumination

upvoted a paper 2 months ago

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

updated a model 6 months ago

yuexishen/codellama-7b-humaneval-ppo-qlora

View all activity

Organizations

None yet

models 11

yuexishen/codellama-7b-humaneval-ppo-qlora

yuexishen/codellama-7b-instruct-humaneval-ppo-qlora

yuexishen/codellama-7b-python-mbpp-grpo-qlora

yuexishen/codellama-7b-python-mbpp-ppo-qlora

yuexishen/codellama-7b-grpo-qlora

yuexishen/deepseek-coder-7b-instruc-ppo-qlora

yuexishen/deepseek-coder-7b-base-v1-ppo-qlora

yuexishen/codellama-7b-mbpp-ppo-qlora

yuexishen/codellama-7b-instruct-ppo-qlora

yuexishen/Llama-3-8B-Instruct-Finance-RAG

Text Generation • 8B • Updated Jan 20 • 3

datasets 0

None public yet