Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2505.14677
Cited By

Visionary-R1: Mitigating Shortcuts in Visual Reasoning with Reinforcement Learning

v1v2v3 (latest)

Visionary-R1: Mitigating Shortcuts in Visual Reasoning with Reinforcement Learning

20 May 2025

ArXiv (abs)PDF HTML HuggingFace (15 upvotes)Github (40★)

Papers citing "Visionary-R1: Mitigating Shortcuts in Visual Reasoning with Reinforcement Learning"

32 / 32 papers shown

Reinforcement Learning for Large Model: A Survey

Reinforcement Learning for Large Model: A Survey

Mike Zheng Shou

323

2

0

24 Dec 2025

TempR1: Improving Temporal Understanding of MLLMs via Temporal-Aware Multi-Task Reinforcement Learning

TempR1: Improving Temporal Understanding of MLLMs via Temporal-Aware Multi-Task Reinforcement Learning

258

0

0

03 Dec 2025

Be My Eyes: Extending Large Language Models to New Modalities Through Multi-Agent Collaboration

Be My Eyes: Extending Large Language Models to New Modalities Through Multi-Agent Collaboration

Tristan Naumann

154

0

0

24 Nov 2025

Syn-GRPO: Self-Evolving Data Synthesis for MLLM Perception Reasoning

Syn-GRPO: Self-Evolving Data Synthesis for MLLM Perception Reasoning

143

0

0

24 Nov 2025

Perceptual-Evidence Anchored Reinforced Learning for Multimodal Reasoning

Perceptual-Evidence Anchored Reinforced Learning for Multimodal Reasoning

252

0

0

23 Nov 2025

Learning to Think Fast and Slow for Visual Language Models

226

0

0

20 Nov 2025

VisPlay: Self-Evolving Vision-Language Models from Images

VisPlay: Self-Evolving Vision-Language Models from Images

Chengsong Huang

403

7

0

19 Nov 2025

SpatialThinker: Reinforcing 3D Reasoning in Multimodal LLMs via Spatial Rewards

SpatialThinker: Reinforcing 3D Reasoning in Multimodal LLMs via Spatial Rewards

376

0

0

10 Nov 2025

Visual Attention Reasoning via Hierarchical Search and Self-Verification

Visual Attention Reasoning via Hierarchical Search and Self-Verification

200

0

0

21 Oct 2025

Proactive Reasoning-with-Retrieval Framework for Medical Multimodal Large Language Models

Proactive Reasoning-with-Retrieval Framework for Medical Multimodal Large Language Models

164

1

0

21 Oct 2025

A Survey on Agentic Multimodal Large Language Models

A Survey on Agentic Multimodal Large Language Models

...

LM&Ro AIFin AI4TS LRM AI4CE

250

6

0

13 Oct 2025

Spotlight on Token Perception for Multimodal Reinforcement Learning

Spotlight on Token Perception for Multimodal Reinforcement Learning

135

2

0

10 Oct 2025

More Thought, Less Accuracy? On the Dual Nature of Reasoning in Vision-Language Models

More Thought, Less Accuracy? On the Dual Nature of Reasoning in Vision-Language Models

Fabian Waschkowski

247

5

0

30 Sep 2025

Latent Visual Reasoning

Latent Visual Reasoning

203

5

0

29 Sep 2025

VTPerception-R1: Enhancing Multimodal Reasoning via Explicit Visual and Textual Perceptual Grounding

VTPerception-R1: Enhancing Multimodal Reasoning via Explicit Visual and Textual Perceptual Grounding

127

0

0

29 Sep 2025

Perception Before Reasoning: Two-Stage Reinforcement Learning for Visual Reasoning in Vision-Language Models

Perception Before Reasoning: Two-Stage Reinforcement Learning for Visual Reasoning in Vision-Language Models

OffRL ReLM LRM VLM

209

6

0

16 Sep 2025

Towards Secure and Explainable Smart Contract Generation with Security-Aware Group Relative Policy Optimization

Towards Secure and Explainable Smart Contract Generation with Security-Aware Group Relative Policy Optimization

196

0

0

12 Sep 2025

Measuring Epistemic Humility in Multimodal Large Language Models

Measuring Epistemic Humility in Multimodal Large Language Models

143

2

0

11 Sep 2025

MMSearch-Plus: Benchmarking Provenance-Aware Search for Multimodal Browsing Agents

MMSearch-Plus: Benchmarking Provenance-Aware Search for Multimodal Browsing Agents

166

0

0

29 Aug 2025

Self-Rewarding Vision-Language Model via Reasoning Decomposition

Self-Rewarding Vision-Language Model via Reasoning Decomposition

Chengsong Huang

...

Jordan L. Boyd-Graber

149

42

0

27 Aug 2025

Uni-cot: Towards Unified Chain-of-Thought Reasoning Across Text and Vision

Uni-cot: Towards Unified Chain-of-Thought Reasoning Across Text and Vision

228

0

0

07 Aug 2025

Don't Overthink It: A Survey of Efficient R1-style Large Reasoning Models

Don't Overthink It: A Survey of Efficient R1-style Large Reasoning Models

...

216

16

0

04 Aug 2025

VL-Cogito: Progressive Curriculum Reinforcement Learning for Advanced Multimodal Reasoning

VL-Cogito: Progressive Curriculum Reinforcement Learning for Advanced Multimodal Reasoning

...

262

13

0

30 Jul 2025

Perception-Aware Policy Optimization for Multimodal Reasoning

Perception-Aware Policy Optimization for Multimodal Reasoning

Zhenhailong Wang

...

423

22

0

08 Jul 2025

Seed1.5-VL Technical Report

Seed1.5-VL Technical Report

...

230

172

0

11 May 2025

Video-R1: Reinforcing Video Reasoning in MLLMs

Video-R1: Reinforcing Video Reasoning in MLLMs

603

235

0

27 Mar 2025

MMCR: Advancing Visual Language Model in Multimodal Multi-Turn Contextual Reasoning

MMCR: Advancing Visual Language Model in Multimodal Multi-Turn Contextual Reasoning

223

5

0

24 Mar 2025

R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization

R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization

425

209

0

17 Mar 2025

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

MU OffRL LRM MLLM ReLM VLM

600

361

0

09 Mar 2025

Qwen2.5-VL Technical Report

Qwen2.5-VL Technical Report

...

725

2,990

0

20 Feb 2025

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Dale Schuurmans

693

419

0

28 Jan 2025

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

...

OffRL AI4TS LRM ReLM VLM

1.3K

5,342

0

22 Jan 2025

Page 1 of 1