VLMs - a ag4304 Collection

ag4304 's Collections

MoEs

VLAs

VLMs

Diffusion models

VLMs

updated about 17 hours ago

Dream-VL & Dream-VLA: Open Vision-Language and Vision-Language-Action Models with Diffusion Language Model Backbone

Paper • 2512.22615 • Published 6 days ago • 38
Learning to Reason in 4D: Dynamic Spatial Understanding for Vision Language Models

Paper • 2512.20557 • Published 10 days ago • 48
TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

Paper • 2512.16093 • Published 16 days ago • 90