QASC: A Dataset for Question Answering via Sentence Composition

25 October 2019

Tushar Khot

Peter Clark

Michal Guerquin

Peter Alexander Jansen

Ashish Sabharwal

CoGe

ArXiv PDF HTML

Papers citing "QASC: A Dataset for Question Answering via Sentence Composition"

50 / 218 papers shown

Title
How Interpretable are Reasoning Explanations from Prompting Large Language Models? Yeo Wei Jie Ranjan Satapathy Rick Mong Erik Cambria ReLM LRM 51 16 0 19 Feb 2024
CyberMetric: A Benchmark Dataset based on Retrieval-Augmented Generation for Evaluating LLMs in Cybersecurity Knowledge Norbert Tihanyi M. Ferrag Ridhi Jain Tamás Bisztray Merouane Debbah ELM 38 20 0 12 Feb 2024
On the Emergence of Cross-Task Linearity in the Pretraining-Finetuning Paradigm Zhanpeng Zhou Zijun Chen Yilan Chen Bo-Wen Zhang Junchi Yan MoMe 19 9 0 06 Feb 2024
Distractor Generation for Multiple-Choice Questions: A Survey of Methods, Datasets, and Evaluation Elaf Alhazmi Quan Z. Sheng W. Zhang Munazza Zaib A. Alhazmi AI4Ed 38 1 0 02 Feb 2024
SEER: Facilitating Structured Reasoning and Explanation via Reinforcement Learning Guoxin Chen Kexin Tang Chao Yang Fuying Ye Yu Qiao Yiming Qian LRM 18 3 0 24 Jan 2024
Improving Large Language Models via Fine-grained Reinforcement Learning with Minimum Editing Constraint Zhipeng Chen Kun Zhou Wayne Xin Zhao Junchen Wan Fuzheng Zhang Di Zhang Ji-Rong Wen KELM 39 32 0 11 Jan 2024
Gemini in Reasoning: Unveiling Commonsense in Multimodal Large Language Models Yuqing Wang Yun Zhao VLM ReLM LRM 26 22 0 29 Dec 2023
CORECODE: A Common Sense Annotated Dialogue Dataset with Benchmark Tasks for Chinese Large Language Models Dan Shi Chaobin You Jian-Tao Huang Taihao Li Deyi Xiong LRM 30 0 0 20 Dec 2023
BaRDa: A Belief and Reasoning Dataset that Separates Factual Accuracy and Reasoning Ability Peter Clark Bhavana Dalvi Oyvind Tafjord 25 2 0 12 Dec 2023
Model Breadcrumbs: Scaling Multi-Task Model Merging with Sparse Masks Mohammad-Javad Davari Eugene Belilovsky MoMe 40 54 0 11 Dec 2023
Merging by Matching Models in Task Parameter Subspaces Derek Tam Mohit Bansal Colin Raffel MoMe 21 10 0 07 Dec 2023
Evaluating the Rationale Understanding of Critical Reasoning in Logical Reading Comprehension Akira Kawabata Saku Sugawara ELM 17 5 0 30 Nov 2023
Fully Authentic Visual Question Answering Dataset from Online Communities Chongyan Chen Mengchen Liu Noel Codella Yunsheng Li Lu Yuan Danna Gurari 41 5 0 27 Nov 2023
Do Smaller Language Models Answer Contextualised Questions Through Memorisation Or Generalisation? Tim Hartill Joshua Bensemann Michael Witbrock Patricia Riddle KELM 22 0 0 21 Nov 2023
Explainable Product Classification for Customs Eunji Lee Sihyeon Kim Sundong Kim Soyeon Jung Heeja Kim Meeyoung Cha 16 6 0 18 Nov 2023
Mirror: A Universal Framework for Various Information Extraction Tasks Tong Zhu Junfei Ren Zijian Yu Mengsong Wu Guoliang Zhang Xiaoye Qu Wenliang Chen Zhefeng Wang Baoxing Huai Min Zhang 29 14 0 09 Nov 2023
Perturbation-based Active Learning for Question Answering Fan Luo Mihai Surdeanu 14 0 0 04 Nov 2023
CASE: Commonsense-Augmented Score with an Expanded Answer Space Wenkai Chen Sahithya Ravi Vered Shwartz 22 0 0 03 Nov 2023
MPrompt: Exploring Multi-level Prompt Tuning for Machine Reading Comprehension Guoxin Chen Yiming Qian Bowen Wang Liangzhi Li 18 7 0 27 Oct 2023
Knowledge Corpus Error in Question Answering Yejoon Lee Philhoon Oh James Thorne 21 2 0 27 Oct 2023
Open-ended Commonsense Reasoning with Unrestricted Answer Scope Chen Ling Xuchao Zhang Xujiang Zhao Yanchi Liu Wei Cheng Mika Oishi Takao Osaki Katsushi Matsuda Haifeng Chen Liang Zhao ReLM LRM 24 1 0 18 Oct 2023
Crystal: Introspective Reasoners Reinforced with Self-Feedback Jiacheng Liu Ramakanth Pasunuru Hannaneh Hajishirzi Yejin Choi Asli Celikyilmaz LRM ReLM 27 22 0 07 Oct 2023
Don't throw away your value model! Generating more preferable text with Value-Guided Monte-Carlo Tree Search decoding Jiacheng Liu Andrew Cohen Ramakanth Pasunuru Yejin Choi Hannaneh Hajishirzi Asli Celikyilmaz 16 24 0 26 Sep 2023
Answering Unseen Questions With Smaller Language Models Using Rationale Generation and Dense Retrieval Tim Hartill Diana Benavides-Prado Michael Witbrock Patricia J. Riddle ReLM LRM 20 1 0 09 Aug 2023
Teaching Smaller Language Models To Generalise To Unseen Compositional Questions Tim Hartill N. Tan Michael Witbrock Patricia J. Riddle ReLM KELM LRM 27 2 0 02 Aug 2023
Meta-training with Demonstration Retrieval for Efficient Few-shot Learning Aaron Mueller Kanika Narang Lambert Mathias Qifan Wang Hamed Firooz RALM 11 3 0 30 Jun 2023
Preserving Commonsense Knowledge from Pre-trained Language Models via Causal Inference Junhao Zheng Qianli Ma Shengjie Qiu Yue Wu Peitian Ma Junlong Liu Hu Feng Xichen Shang Haibin Chen AAML KELM CML CLL 81 15 0 19 Jun 2023
Encyclopedic VQA: Visual questions about detailed properties of fine-grained categories Thomas Mensink J. Uijlings Lluis Castrejon A. Goel Felipe Cadar Howard Zhou Fei Sha A. Araújo V. Ferrari 34 37 0 15 Jun 2023
ECGBERT: Understanding Hidden Language of ECGs with Self-Supervised Representation Learning Seokmin Choi Sajad Mousavi Phillip Si Haben Yhdego Fatemeh Khadem Fatemeh Afghah SSL 29 3 0 10 Jun 2023
TIES-Merging: Resolving Interference When Merging Models Prateek Yadav Derek Tam Leshem Choshen Colin Raffel Mohit Bansal MoMe 40 250 0 02 Jun 2023
Estimating Semantic Similarity between In-Domain and Out-of-Domain Samples Rhitabrat Pokharel Ameeta Agrawal OODD 21 2 0 01 Jun 2023
Explanation Graph Generation via Generative Pre-training over Synthetic Graphs H. Cui Sha Li Yu Zhang Qi Shi 11 1 0 01 Jun 2023
UFO: Unified Fact Obtaining for Commonsense Question Answering Zhifeng Li Yifan Fan Bowei Zou Yu Hong HILM LRM 25 1 0 25 May 2023
Getting MoRE out of Mixture of Language Model Reasoning Experts Chenglei Si Weijia Shi Chen Zhao Luke Zettlemoyer Jordan L. Boyd-Graber LRM 24 24 0 24 May 2023
RetICL: Sequential Retrieval of In-Context Examples with Reinforcement Learning Alexander Scarlatos Andrew S. Lan OffRL LRM 27 20 0 23 May 2023
Active Learning Principles for In-Context Learning with Large Language Models Katerina Margatina Timo Schick Nikolaos Aletras Jane Dwivedi-Yu 27 39 0 23 May 2023
The CoT Collection: Improving Zero-shot and Few-shot Learning of Language Models via Chain-of-Thought Fine-Tuning Seungone Kim Se June Joo Doyoung Kim Joel Jang Seonghyeon Ye Jamin Shin Minjoon Seo ALM RALM LRM 23 96 0 23 May 2023
Iterative Forward Tuning Boosts In-Context Learning in Language Models Jiaxi Yang Binyuan Hui Min Yang Bailin Wang Bowen Li Binhua Li Fei Huang Yongbin Li 25 16 0 22 May 2023
Task Arithmetic in the Tangent Space: Improved Editing of Pre-Trained Models Guillermo Ortiz-Jiménez Alessandro Favero P. Frossard MoMe 48 106 0 22 May 2023
Prompting with Pseudo-Code Instructions Mayank Mishra Prince Kumar Riyaz Ahmad Bhat V. Rudramurthy Danish Contractor Srikanth G. Tamilselvam 42 13 0 19 May 2023
M3KE: A Massive Multi-Level Multi-Subject Knowledge Evaluation Benchmark for Chinese Large Language Models Chuang Liu Renren Jin Yuqi Ren Linhao Yu Tianyu Dong ... Peiyi Zhang Qingqing Lyu Xiaowen Su Qun Liu Deyi Xiong ELM ALM 16 24 0 17 May 2023
Pre-Training to Learn in Context Yuxian Gu Li Dong Furu Wei Minlie Huang CLIP LRM ReLM 108 37 0 16 May 2023
Assessing Hidden Risks of LLMs: An Empirical Study on Robustness, Consistency, and Credibility Wen-song Ye Mingfeng Ou Tianyi Li Yipeng Chen Xuetao Ma ... Sai Wu Jie Fu Gang Chen Haobo Wang J. Zhao 42 36 0 15 May 2023
Distinguish Before Answer: Generating Contrastive Explanation as Knowledge for Commonsense Question Answering Qianglong Chen Guohai Xu Mingshi Yan Ji Zhang Fei Huang Luo Si Yin Zhang 18 9 0 14 May 2023
Long-Tailed Question Answering in an Open World Yinpei Dai Hao Lang Yinhe Zheng Fei Huang Yongbin Li VLM 22 7 0 11 May 2023
Vera: A General-Purpose Plausibility Estimation Model for Commonsense Statements Jiacheng Liu Wenya Wang Dianzhuo Wang Noah A. Smith Yejin Choi Hannaneh Hajishirzi VLM 39 48 0 05 May 2023
Can LLM Already Serve as A Database Interface? A BIg Bench for Large-Scale Database Grounded Text-to-SQLs Jinyang Li Binyuan Hui Ge Qu Jiaxi Yang Binhua Li ... Guoliang Li Kevin C. C. Chang Fei Huang Reynold Cheng Yongbin Li LMTD 36 356 0 04 May 2023
SCOTT: Self-Consistent Chain-of-Thought Distillation Jamie Yap Zhengyang Wang Zheng Li K. Lynch Bing Yin Xiang Ren LRM 61 92 0 03 May 2023
Exploring Effective Factors for Improving Visual In-Context Learning Yanpeng Sun Qiang Chen Jian Wang Jingdong Wang Zechao Li LRM VLM 43 24 0 10 Apr 2023
FrenchMedMCQA: A French Multiple-Choice Question Answering Dataset for Medical domain Yanis Labrak Adrien Bazoge Richard Dufour Mickael Rouvier Emmanuel Morin B. Daille P. Gourraud 19 30 0 09 Apr 2023