2 481 94

oh sehun

sehun

AI & ML interests

None yet

Recent Activity

upvoted an article about 13 hours ago

Deploying Open Source Vision Language Models (VLM) on Jetson

upvoted a paper about 15 hours ago

From Perception to Action: An Interactive Benchmark for Vision Reasoning

upvoted a paper about 16 hours ago

A Very Big Video Reasoning Suite

View all activity

Organizations

upvoted an article about 13 hours ago

Article

Deploying Open Source Vision Language Models (VLM) on Jetson

2 days ago

•

upvoted a paper about 15 hours ago

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Paper • 2602.21015 • Published 1 day ago • 21

upvoted a paper about 16 hours ago

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published 2 days ago • 381

upvoted a paper about 18 hours ago

DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning

Paper • 2602.16742 • Published 8 days ago • 7

upvoted a paper 5 days ago

SpargeAttention2: Trainable Sparse Attention via Hybrid Top-k+Top-p Masking and Distillation Fine-Tuning

Paper • 2602.13515 • Published 12 days ago • 43

upvoted an article 5 days ago

Article

Train AI models with Unsloth and Hugging Face Jobs for FREE

6 days ago

•

upvoted a paper 6 days ago

RynnBrain: Open Embodied Foundation Models

Paper • 2602.14979 • Published 12 days ago • 42

upvoted a paper 7 days ago

GLM-5: from Vibe Coding to Agentic Engineering

Paper • 2602.15763 • Published 8 days ago • 94

liked a model 8 days ago

shallowdream204/BitDance-14B-16x

Text-to-Image • 15B • Updated 8 days ago • 213 • 83

upvoted 2 papers 8 days ago

Experiential Reinforcement Learning

Paper • 2602.13949 • Published 11 days ago • 67

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Paper • 2602.11858 • Published 14 days ago • 58

upvoted a collection 8 days ago

Tiny Aya

Collection

Bridging Scale and Multilingual Depth • 10 items • Updated 9 days ago • 60

upvoted a collection 9 days ago

BitDance

Collection

BitDance: Open-source autoregressive model with binary visual tokens. A research project for building powerful multimodal autoregressive model. • 11 items • Updated 4 days ago • 9

liked a model 9 days ago

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated 2 days ago • 483k • • 1.06k

upvoted a paper 11 days ago

Voxtral Realtime

Paper • 2602.11298 • Published 14 days ago • 16

upvoted an article 11 days ago

Article

Forge: Scalable Agent RL Framework and Algorithm

13 days ago

•

126

upvoted a paper 11 days ago

Gaia2: Benchmarking LLM Agents on Dynamic and Asynchronous Environments

Paper • 2602.11964 • Published 13 days ago • 12

liked a Space 12 days ago

Recommend Similar Papers

🌖

177

Get similar paper recommendations from a Hugging Face link

upvoted 2 papers 12 days ago

Think Longer to Explore Deeper: Learn to Explore In-Context via Length-Incentivized Reinforcement Learning

Paper • 2602.11748 • Published 14 days ago • 30

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Paper • 2602.12036 • Published 13 days ago • 97

oh sehun

AI & ML interests

Recent Activity

Organizations

sehun's activity

Deploying Open Source Vision Language Models (VLM) on Jetson

Train AI models with Unsloth and Hugging Face Jobs for FREE

Forge: Scalable Agent RL Framework and Algorithm

Recommend Similar Papers