Du Ricky PRO

sddwt

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

upvoted a collection 9 days ago

Emu3.5

upvoted a paper 10 days ago

CodeOCR: On the Effectiveness of Vision Language Models in Code Understanding

View all activity

Organizations

None yet

upvoted a paper 2 days ago

Step 3.5 Flash: Open Frontier-Level Intelligence with 11B Active Parameters

Paper • 2602.10604 • Published 4 days ago • 174

upvoted a collection 9 days ago

Emu3.5

Collection

Native Multimodal Models are World Learners 🌍 • 4 items • Updated 12 days ago • 74

upvoted 2 papers 10 days ago

CodeOCR: On the Effectiveness of Vision Language Models in Code Understanding

Paper • 2602.01785 • Published 13 days ago • 93

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published 17 days ago • 152

upvoted a paper 11 days ago

SoMA: A Real-to-Sim Neural Simulator for Robotic Soft-body Manipulation

Paper • 2602.02402 • Published 13 days ago • 32

upvoted 2 papers 12 days ago

Green-VLA: Staged Vision-Language-Action Model for Generalist Robots

Paper • 2602.00919 • Published 15 days ago • 279

3D-Aware Implicit Motion Control for View-Adaptive Human Video Generation

Paper • 2602.03796 • Published 12 days ago • 57

upvoted a paper 13 days ago

DynamicVLA: A Vision-Language-Action Model for Dynamic Object Manipulation

Paper • 2601.22153 • Published 17 days ago • 68

liked a model 16 days ago

prompthero/openjourney

Text-to-Image • 0.1B • Updated May 15, 2023 • 7.35k • 3.19k

liked 2 Spaces 16 days ago

Qwen Image Edit Camera Control

🎬

1.98k

Fast 4 step inference with Qwen Image Edit 2509

Z Image

🏃

122

Generate high‑quality images from text prompts with Z‑Image

liked 3 models 16 days ago

liked 2 models 17 days ago

facebook/bart-large-mnli

Zero-Shot Classification • 0.4B • Updated Sep 5, 2023 • 3.48M • • 1.53k

sentence-transformers/all-MiniLM-L6-v2

liked 3 models 19 days ago

coqui/XTTS-v2

Text-to-Speech • Updated Dec 11, 2023 • 6.5M • 3.39k

hexgrad/Kokoro-82M

Text-to-Speech • Updated Apr 10, 2025 • 7.17M • • 5.7k

Qwen/Qwen3-TTS-12Hz-0.6B-Base

Text-to-Speech • Updated 17 days ago • 210k • 169

upvoted a paper 21 days ago

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Paper • 2601.15876 • Published 24 days ago • 90