v1v2 (latest)

OBI-Bench: Can LMMs Aid in Study of Ancient Script on Oracle Bones?

International Conference on Learning Representations (ICLR), 2024

2 December 2024

Papers citing "OBI-Bench: Can LMMs Aid in Study of Ancient Script on Oracle Bones?"

42 / 42 papers shown

MACEval: A Multi-Agent Continual Evaluation Network for Large Models

214

12 Nov 2025

OracleAgent: A Multimodal Reasoning Agent for Oracle Bone Script Research

...

120

30 Oct 2025

PictOBI-20k: Unveiling Large Multimodal Models in Visual Decipherment for Pictographic Oracle Bone Characters

102

06 Sep 2025

Interpretable Oracle Bone Script Decipherment through Radical and Pictographic Analysis with LVLMs

140

13 Aug 2025

PuzzleBench: A Fully Dynamic Evaluation Framework for Large Multimodal Models on Puzzle Solving

177

15 Apr 2025

Mitigating Long-tail Distribution in Oracle Bone Inscriptions: Dataset, Model, and Benchmark

271

13 Apr 2025

DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms

968

05 Mar 2025

xGen-MM (BLIP-3): A Family of Open Large Multimodal Models

...

525

141

16 Aug 2024

mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language ModelsInternational Conference on Learning Representations (ICLR), 2024

Ming Yan

Fei Huang

Jingren Zhou

MLLM VLM

313

225

09 Aug 2024

MiniCPM-V: A GPT-4V Level MLLM on Your Phone

Yuan Yao

Tianyu Yu

Ao Zhang

Chongyi Wang

Junbo Cui

...

Xu Han

Maosong Sun

447

868

03 Aug 2024

ChatGLM: A Family of Large Language Models from GLM-130B to GLM-4 All Tools

Team GLM

Aohan Zeng

Bin Xu

Bowen Wang

...

Zhaoyu Wang

Zhen Yang

Zhengxiao Du

Zhenyu Hou

Zihan Wang

ALM

371

1,167

18 Jun 2024

GAIA: Rethinking Action Quality Assessment for AI-Generated VideosNeural Information Processing Systems (NeurIPS), 2024

Zijian Chen

Yuan Tian

Guangtao Zhai

312

10 Jun 2024

A-Bench: Are LMMs Masters at Evaluating AI-generated Images?

Zijian Chen

372

05 Jun 2024

Deciphering Oracle Bone Language with Diffusion Models

426

02 Jun 2024

What matters when building vision-language models?Neural Information Processing Systems (NeurIPS), 2024

299

274

03 May 2024

InternLM2 Technical Report

...

Xipeng Qiu

Yu Qiao

Dahua Lin

ALM

288

308

26 Mar 2024

DeepSeek-VL: Towards Real-World Vision-Language Understanding

...

Chengqi Deng

437

642

08 Mar 2024

Multi-modal Instruction Tuned LLMs with Fine-grained Visual Perception

Jun-Yan He

Yifan Wang

Lijun Wang

Huchuan Lu

Jun-Yan He

224

05 Mar 2024

When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method

280

231

27 Feb 2024

The Revolution of Multimodal Large Language Models: A Survey

Lorenzo Baraldi

355

121

19 Feb 2024

InternLM-XComposer2: Mastering Free-form Text-Image Composition and Comprehension in Vision-Language Large Model

...

Conghui He

Xingcheng Zhang

Yu Qiao

Dahua Lin

Yuan Liu

VLM MLLM

366

342

29 Jan 2024

An open dataset for oracle bone script recognition and deciphermentScientific Data (Sci Data), 2024

Yongge Liu

...

Lianwen Jin

Yuliang Liu

193

27 Jan 2024

An open dataset for the evolution of oracle bone characters: EVOBC

Yuliang Liu

Lianwen Jin

279

23 Jan 2024

Eyes Wide Shut? Exploring the Visual Shortcomings of Multimodal LLMsComputer Vision and Pattern Recognition (CVPR), 2024

Shengbang Tong

412

552

11 Jan 2024

InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks

Weijie Su

...

Ping Luo

Yu Qiao

635

2,168

21 Dec 2023

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGIComputer Vision and Pattern Recognition (CVPR), 2023

...

849

1,600

27 Nov 2023

CogVLM: Visual Expert for Pretrained Language ModelsNeural Information Processing Systems (NeurIPS), 2023

Weihan Wang

Qingsong Lv

Wenmeng Yu

Wenyi Hong

Ji Qi

...

Bin Xu

Juanzi Li

Yuxiao Dong

Ming Ding

Jie Tang

VLM MLLM

649

709

06 Nov 2023

Unleashing the potential of prompt engineering in Large Language Models: a comprehensive review

429

23 Oct 2023

Q-Bench: A Benchmark for General-Purpose Foundation Models on Low-level VisionInternational Conference on Learning Representations (ICLR), 2023

Haoning Wu

Zicheng Zhang

Erli Zhang

Chaofeng Chen

Liang Liao

...

Chunyi Li

Wenxiu Sun

Qiong Yan

Guangtao Zhai

Weisi Lin

VLM

364

223

25 Sep 2023

Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond

Jinze Bai

Shuai Bai

Shusheng Yang

Shijie Wang

Sinan Tan

Peng Wang

Junyang Lin

Chang Zhou

Jingren Zhou

MLLM VLM ObjD

513

1,565

24 Aug 2023

AgentBench: Evaluating LLMs as AgentsInternational Conference on Learning Representations (ICLR), 2023

...

526

494

07 Aug 2023

Toward Zero-shot Character Recognition: A Gold Standard Dataset with Radical-level AnnotationsACM Multimedia (ACM MM), 2023

165

01 Aug 2023

MMBench: Is Your Multi-modal Model an All-around Player?European Conference on Computer Vision (ECCV), 2023

...

Conghui He

Ziwei Liu

Kai-xiang Chen

Dahua Lin

674

1,646

12 Jul 2023

Mitigating Hallucination in Large Multi-Modal Models via Robust Instruction TuningInternational Conference on Learning Representations (ICLR), 2023

Fuxiao Liu

427

399

26 Jun 2023

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models

...

769

1,219

23 Jun 2023

Visual Instruction TuningNeural Information Processing Systems (NeurIPS), 2023

1.1K

7,377

17 Apr 2023

GPT-4 Technical Report

...

4.6K

20,717

15 Mar 2023

Large Language Models Are Human-Level Prompt EngineersInternational Conference on Learning Representations (ICLR), 2022

Silviu Pitis

Jimmy Ba

467

1,167

03 Nov 2022

Unsupervised Structure-Texture Separation Network for Oracle Character RecognitionIEEE Transactions on Image Processing (IEEE TIP), 2022

Mei Wang

Weihong Deng

Chenguang Liu

206

13 May 2022

Recognition of Oracle Bone Inscriptions by using Two Deep Learning ModelsInternational Journal of Digital Humanities (IJDH), 2021

235

03 May 2021

BERTScore: Evaluating Text Generation with BERT

2.3K

7,458

21 Apr 2019

NIMA: Neural Image Assessment

Hossein Talebi

P. Milanfar

3DH

408

1,057

15 Sep 2017