Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Search

9 September 2025

ArXiv (abs)PDF HTML HuggingFace (57 upvotes)Github (33★)

Papers citing "Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Search"

14 / 14 papers shown

ARM-Thinker: Reinforcing Multimodal Generative Reward Models with Agentic Tool Use and Visual Reasoning

...

194

04 Dec 2025

AdaptVision: Efficient Vision-Language Models via Adaptive Visual Acquisition

03 Dec 2025

Thinking with Programming Vision: Towards a Unified View for Thinking with Images

204

03 Dec 2025

JarvisEvo: Towards a Self-Evolving Photo Editing Agent with Synergistic Editor-Evaluator Optimization

...

244

28 Nov 2025

Qwen3-VL Technical Report

...

1.6K

26 Nov 2025

Boosting Reasoning in Large Multimodal Models via Activation Replay

237

25 Nov 2025

The Image as Its Own Reward: Reinforcement Learning with Adversarial Reward for Image Generation

272

25 Nov 2025

Thinking in 360°: Humanoid Visual Search in the Wild

...

334

25 Nov 2025

GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization

401

19 Nov 2025

DeepEyesV2: Toward Agentic Multimodal ModelIEEE Transactions on Audio, Speech, and Language Processing (TASLP), 2025

130

07 Nov 2025

TIR-Bench: A Comprehensive Benchmark for Agentic Thinking-with-Images Reasoning

462

03 Nov 2025

ViPER: Empowering the Self-Evolution of Visual Perception Abilities in Vision-Language Model

...

213

28 Oct 2025

A Survey on Agentic Multimodal Large Language Models

...

LM&Ro AIFin AI4TS LRM AI4CE

250

13 Oct 2025

Pathology-CoT: Learning Visual Chain-of-Thought Agent from Expert Whole Slide Image Diagnosis Behavior

159

06 Oct 2025