Lijun Wu's picture

Lijun Wu

apeters

·

https://apeterswu.github.io/

AI & ML interests

None yet

Recent Activity

liked a model about 10 hours ago

QizhiPei/biot5-plus-base

liked a model about 10 hours ago

QizhiPei/biot5-base

updated a collection about 14 hours ago

View all activity

Organizations

liked 2 models about 10 hours ago

QizhiPei/biot5-plus-base

0.3B • Updated Feb 20, 2025 • 11.5k • 2

QizhiPei/biot5-base

0.3B • Updated Feb 20, 2025 • 30.6k • 9

updated a collection about 14 hours ago

MMFineReason

High-quality STEM reasoning dataset for Multimodal LLM post-training. • 13 items • Updated about 14 hours ago • 17

upvoted a collection 1 day ago

MMFineReason

High-quality STEM reasoning dataset for Multimodal LLM post-training. • 13 items • Updated about 14 hours ago • 17

liked 2 datasets 1 day ago

OpenDataArena/MMFineReason-SFT-123K-Qwen3-VL-235B-Thinking

Viewer • Updated 1 day ago • 123k • 20 • 19

OpenDataArena/MMFineReason-1.8M-Qwen3-VL-235B-Thinking

Viewer • Updated 1 day ago • 1.81M • 14 • 47

upvoted a paper 1 day ago

MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods

Paper • 2601.21821 • Published 2 days ago • 45

upvoted 2 papers 5 days ago

Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility

Paper • 2601.17027 • Published 14 days ago • 40

ChartVerse: Scaling Chart Reasoning via Reliable Programmatic Synthesis from Scratch

Paper • 2601.13606 • Published 12 days ago • 10

submitted a paper to Daily Papers 5 days ago

ChartVerse: Scaling Chart Reasoning via Reliable Programmatic Synthesis from Scratch

Paper • 2601.13606 • Published 12 days ago • 10

liked a dataset 5 days ago

opendatalab/ChartVerse-SFT-1800K

Viewer • Updated 1 day ago • 1.88M • 2.07k • 119

updated 3 datasets 11 days ago

OpenDataArena/ODA-Mixture-100k

Viewer • Updated 11 days ago • 101k • 4.35k • 95

OpenDataArena/ODA-Mixture-500k

Viewer • Updated 11 days ago • 506k • 7.24k • 121

OpenDataArena/ODA-Math-460k

Viewer • Updated 11 days ago • 460k • 7.11k • 102

upvoted a collection 11 days ago

BioT5

BioT5 and BioT5+ collections • 18 items • Updated Oct 23, 2025 • 3

upvoted 2 collections 14 days ago

ODA-Mixture

High-quality mixture datasets for post-training covering multiple domains. • 7 items • Updated 15 days ago • 4

ODA-Math

High-quality mathematical datasets for post training. • 5 items • Updated 15 days ago • 1

updated 2 collections 15 days ago

ODA-Mixture

High-quality mixture datasets for post-training covering multiple domains. • 7 items • Updated 15 days ago • 4

ODA-Math

High-quality mathematical datasets for post training. • 5 items • Updated 15 days ago • 1

upvoted a paper 15 days ago

Closing the Data Loop: Using OpenDataArena to Engineer Superior Training Datasets

Paper • 2601.09733 • Published Dec 30, 2025 • 8