v1v2 (latest)

The Open Images Dataset V4: Unified image classification, object detection, and visual relationship detection at scale

2 November 2018

Papers citing "The Open Images Dataset V4: Unified image classification, object detection, and visual relationship detection at scale"

50 / 623 papers shown

DualCoOp++: Fast and Effective Adaptation to Multi-Label Recognition with Limited AnnotationsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

335

03 Aug 2023

ZRIGF: An Innovative Multimodal Framework for Zero-Resource Image-Grounded Dialogue GenerationACM Multimedia (ACM MM), 2023

194

01 Aug 2023

Towards Imbalanced Large Scale Multi-label Classification with Partially Annotated LabelsInternational Conference on Software Engineering Research and Applications (ICSERA), 2023

281

31 Jul 2023

CLIP Brings Better Features to Visual Aesthetics Learners

215

28 Jul 2023

Digitally-Enhanced Dog Behavioral Testing: Getting Help from the MachineScientific Reports (Sci Rep), 2023

199

26 Jul 2023

Towards Establishing Systematic Classification Requirements for Automated Driving

Kent Mori

Trent Brown

Steven C. Peters

224

26 Jul 2023

Subject-Diffusion:Open Domain Personalized Text-to-Image Generation without Test-time Fine-tuningInternational Conference on Computer Graphics and Interactive Techniques (SIGGRAPH), 2023

298

197

21 Jul 2023

Interactive Segmentation for Diverse Gesture Types Without ContextIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

306

20 Jul 2023

In Defense of Clip-based Video Relation DetectionIEEE Transactions on Image Processing (IEEE TIP), 2023

Meng Wei

Long Chen

Wei Ji

Xiaoyu Yue

Roger Zimmermann

182

18 Jul 2023

Pair then Relation: Pair-Net for Panoptic Scene Graph GenerationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Xiangtai Li

Ziwei Liu

221

17 Jul 2023

Revisiting Scene Text Recognition: A Data PerspectiveIEEE International Conference on Computer Vision (ICCV), 2023

Lianwen Jin

352

17 Jul 2023

DynamicFL: Balancing Communication Dynamics and Client Manipulation for Federated LearningAnnual IEEE Communications Society Conference on Sensor, Mesh and Ad Hoc Communications and Networks (SECON), 2023

Bocheng Chen

Nikolay Ivanov

Guangjing Wang

Qiben Yan

207

16 Jul 2023

EmoSet: A Large-scale Visual Emotion Dataset with Rich AttributesIEEE International Conference on Computer Vision (ICCV), 2023

Daniel Cohen-Or

213

16 Jul 2023

Unbiased Scene Graph Generation via Two-stage Causal ModelingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

264

11 Jul 2023

End-to-End Supervised Multilabel Contrastive Learning

A. Sajedi

Samir Khaki

Konstantinos N. Plataniotis

Mahdi S. Hosseini

SSL

179

08 Jul 2023

Pollen: High-throughput Federated Learning Simulation via Resource-Aware Client Placement

Javier Fernandez-Marques

Nicholas D. Lane

242

30 Jun 2023

Transferability Metrics for Object Detection

Louis Fouquet

Simona Maggio

L. Dreyfus-Schmidt

153

27 Jun 2023

ParameterNet: Parameters Are All You NeedComputer Vision and Pattern Recognition (CVPR), 2023

158

26 Jun 2023

DISCO-10M: A Large-Scale Music DatasetNeural Information Processing Systems (NeurIPS), 2023

Luca A. Lanzendörfer

Florian Grötschla

Emil Funke

Roger Wattenhofer

125

23 Jun 2023

Towards Unseen Triples: Effective Text-Image-joint Learning for Scene Graph Generation

Ying Shan

145

23 Jun 2023

Label-noise-tolerant medical image classification via self-attention and self-supervised learning

140

16 Jun 2023

Scaling Open-Vocabulary Object DetectionNeural Information Processing Systems (NeurIPS), 2023

424

315

16 Jun 2023

ScaleDet: A Scalable Multi-Dataset Object DetectorComputer Vision and Pattern Recognition (CVPR), 2023

177

08 Jun 2023

Coarse Is Better? A New Pipeline Towards Self-Supervised Learning with Uncurated ImagesPattern Recognition (Pattern Recogn.), 2023

Ke Zhu

Yin He

Jianxin Wu

255

07 Jun 2023

The ObjectFolder Benchmark: Multisensory Learning with Neural and Real ObjectsComputer Vision and Pattern Recognition (CVPR), 2023

Yunzhu Li

Li Fei-Fei

Jiajun Wu

155

01 Jun 2023

Joint Adaptive Representations for Image-Language Learning

A. Piergiovanni

A. Angelova

VLM

278

31 May 2023

What Can We Learn from Unlearnable Datasets?Neural Information Processing Systems (NeurIPS), 2023

Pedro Sandoval-Segura

279

30 May 2023

Contextual Object Detection with Multimodal Large Language ModelsInternational Journal of Computer Vision (IJCV), 2023

328

141

29 May 2023

Learning high-level visual representations from a child's perspective without strong inductive biases

A. Orhan

Brenden M. Lake

SSL

263

24 May 2023

NeSy4VRD: A Multifaceted Resource for Neurosymbolic AI Research using Knowledge Graphs in Visual Relationship Detection

188

22 May 2023

Relabeling Minimal Training Subset to Flip a PredictionFindings (Findings), 2023

Jinghan Yang

Linjie Xu

Lequan Yu

305

22 May 2023

Annotation-free Audio-Visual SegmentationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

395

18 May 2023

Rethinking Multimodal Content Moderation from an Asymmetric Angle with Mixed-modalityIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

215

17 May 2023

Restoring Images Captured in Arbitrary Hybrid Adverse Weather Conditions in One Go

208

17 May 2023

ICDAR 2023 Competition on Hierarchical Text Detection and RecognitionIEEE International Conference on Document Analysis and Recognition (ICDAR), 2023

Yasuhisa Fujii

189

16 May 2023

ElasticHash: Semantic Image Similarity Search by Deep Hashing with ElasticsearchInternational Conference on Computer Analysis of Images and Patterns (CAIP), 2023

Nikolaus Korfhage

M. Mühling

Bernd Freisleben

149

08 May 2023

OpenViVQA: Task, Dataset, and Multimodal Fusion Models for Visual Question Answering in VietnameseInformation Fusion (Inf. Fusion), 2023

196

07 May 2023

Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label LearningNeural Information Processing Systems (NeurIPS), 2023

276

04 May 2023

A Neural Divide-and-Conquer Reasoning Framework for Image Retrieval from Linguistically Complex TextAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Yunxin Li

Baotian Hu

Yuxin Ding

Lin Ma

Hao Fei

216

03 May 2023

An Extensible Multimodal Multi-task Object Dataset with MaterialsInternational Conference on Learning Representations (ICLR), 2023

Trevor Scott Standley

Ruohan Gao

Dawn Chen

Jiajun Wu

Silvio Savarese

141

29 Apr 2023

Controllable Image Generation via Collage Representations

Arantxa Casanova

Marlene Careil

Adriana Romero Soriano

219

26 Apr 2023

LEMaRT: Label-Efficient Masked Region Transform for Image HarmonizationComputer Vision and Pattern Recognition (CVPR), 2023

279

25 Apr 2023

Docmarking: Real-Time Screen-Cam Robust Document Image Watermarking

25 Apr 2023

Building Multimodal AI Chatbots

Mingyu Lee

156

21 Apr 2023

ShapeClipper: Scalable 3D Shape Learning from Single-View Images via Geometric and CLIP-based ConsistencyComputer Vision and Pattern Recognition (CVPR), 2023

Zixuan Huang

Yuanzhen Li

192

13 Apr 2023

ImageCaptioner

^2

: Image Captioner for Image Captioning Bias Amplification AssessmentAAAI Conference on Artificial Intelligence (AAAI), 2023

200

10 Apr 2023

Knowledge Combination to Learn Rotated Detection Without Rotated AnnotationComputer Vision and Pattern Recognition (CVPR), 2023

238

05 Apr 2023

Locate Then Generate: Bridging Vision and Language with Bounding Box for Scene-Text VQAAAAI Conference on Artificial Intelligence (AAAI), 2023

Xin Li

166

04 Apr 2023

Mask-free OVIS: Open-Vocabulary Instance Segmentation without Manual Mask AnnotationsComputer Vision and Pattern Recognition (CVPR), 2023

Ran Xu

252

29 Mar 2023

Egocentric Auditory Attention Localization in ConversationsComputer Vision and Pattern Recognition (CVPR), 2023

229

28 Mar 2023