Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2505.20728
Cited By

Jigsaw-Puzzles: From Seeing to Understanding to Reasoning in Vision-Language Models

v1v2v3v4 (latest)

Jigsaw-Puzzles: From Seeing to Understanding to Reasoning in Vision-Language Models

27 May 2025

ArXiv (abs)PDF HTML

Papers citing "Jigsaw-Puzzles: From Seeing to Understanding to Reasoning in Vision-Language Models"

4 / 4 papers shown

GRAID: Enhancing Spatial Reasoning of VLMs Through High-Fidelity Data Generation

GRAID: Enhancing Spatial Reasoning of VLMs Through High-Fidelity Data Generation

Karim Elmaaroufi

Justin Svegliato

Sanjit A. Seshia

Matei A. Zaharia

203

0

0

25 Oct 2025

Why Reinforcement Fine-Tuning Enables MLLMs Preserve Prior Knowledge Better: A Data Perspective

Why Reinforcement Fine-Tuning Enables MLLMs Preserve Prior Knowledge Better: A Data Perspective

...

233

0

0

30 Jun 2025

CAPTURe: Evaluating Spatial Reasoning in Vision Language Models via Occluded Object Counting

CAPTURe: Evaluating Spatial Reasoning in Vision Language Models via Occluded Object Counting

Elias Stengel-Eskin

Joey Tianyi Zhou

401

19

0

21 Apr 2025

LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?

LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?

447

31

0

25 Mar 2025

Page 1 of 1