NegotiationToM: A Benchmark for Stress-testing Machine Theory of Mind on Negotiation Surrounding

21 April 2024

Papers citing "NegotiationToM: A Benchmark for Stress-testing Machine Theory of Mind on Negotiation Surrounding"

22 / 22 papers shown

Title
PolicyEvol-Agent: Evolving Policy via Environment Perception and Self-Awareness with Theory of Mind Yajie Yu Yue Feng LLMAG 26 0 0 20 Apr 2025
Rethinking Theory of Mind Benchmarks for LLMs: Towards A User-Centered Perspective Qiaosi Wang Xuhui Zhou Maarten Sap Jodi Forlizzi Hong Shen 26 0 0 15 Apr 2025
PersuasiveToM: A Benchmark for Evaluating Machine Theory of Mind in Persuasive Dialogues Fangxu Yu Lai Jiang Shenyi Huang Zhen Wu Xinyu Dai LLMAG 80 0 0 28 Feb 2025
Persuasion Should be Double-Blind: A Multi-Domain Dialogue Dataset With Faithfulness Based on Causal Theory of Mind Dingyi Zhang Deyu Zhou 61 0 0 28 Feb 2025
HARBOR: Exploring Persona Dynamics in Multi-Agent Competition Kenan Jiang Li Xiong Fei Liu 47 0 0 17 Feb 2025
Mind Your Theory: Theory of Mind Goes Deeper Than Reasoning Eitan Wagner Nitay Alon J. Barnby Omri Abend LRM 85 2 0 18 Dec 2024
EgoSocialArena: Benchmarking the Social Intelligence of Large Language Models from a First-person Perspective Guiyang Hou Wenqi Zhang Yongliang Shen Zeqi Tan Sihao Shen Weiming Lu 26 0 0 08 Oct 2024
Persona Knowledge-Aligned Prompt Tuning Method for Online Debate Chunkit Chan Cheng Jiayang Xin Liu Yauwai Yim Yuxin Jiang Zheye Deng Haoran Li Yangqiu Song Ginny Y. Wong Simon See 26 0 0 05 Oct 2024
ECon: On the Detection and Resolution of Evidence Conflicts Cheng Jiayang Chunkit Chan Qianqian Zhuang Lin Qiu Tianhang Zhang Tengxiao Liu Yangqiu Song Yue Zhang Pengfei Liu Zheng Zhang 28 1 0 05 Oct 2024
Constrained Reasoning Chains for Enhancing Theory-of-Mind in Large Language Models Zizheng Lin Chunkit Chan Yangqiu Song Xin Liu LRM 19 1 0 20 Sep 2024
MuMA-ToM: Multi-modal Multi-Agent Theory of Mind Haojun Shi Suyu Ye Xinyu Fang Chuanyang Jin Leyla Isik Yen-Ling Kuo Tianmin Shu LLMAG 48 7 0 22 Aug 2024
Evaluating and Enhancing LLMs Agent based on Theory of Mind in Guandan: A Multi-Player Cooperative Game under Imperfect Information Yauwai Yim Chunkit Chan Tianyu Shi Zheye Deng Wei Fan Tianshi Zheng Yangqiu Song LLMAG 18 8 0 05 Aug 2024
On the Role of Entity and Event Level Conceptualization in Generalizable Reasoning: A Survey of Tasks, Methods, Applications, and Future Directions Weiqi Wang Tianqing Fang Haochen Shi Baixuan Xu Wenxuan Ding ... Wei Fan Jiaxin Bai Haoran Li Xin Liu Yangqiu Song LRM 16 0 0 16 Jun 2024
EventGround: Narrative Reasoning by Grounding to Eventuality-centric Knowledge Graphs Cheng Jiayang Lin Qiu Chunkit Chan Xin Liu Yangqiu Song Zheng-Wei Zhang 36 5 0 30 Mar 2024
MIKO: Multimodal Intention Knowledge Distillation from Large Language Models for Social-Media Commonsense Discovery Feihong Lu Weiqi Wang Yangyifei Luo Ziqin Zhu Qingyun Sun ... Haochen Shi Shiqi Gao Qian Li Yangqiu Song Jianxin Li VLM 27 2 0 28 Feb 2024
Let's Negotiate! A Survey of Negotiation Dialogue Systems Haolan Zhan Yufei Wang Tao Feng Yuncheng Hua Suraj Sharma Zhuang Li Lizhen Qu Zhaleh Semnani Azad Ingrid Zukerman Gholamreza Haffari LLMAG 68 27 0 02 Feb 2024
CANDLE: Iterative Conceptualization and Instantiation Distillation from Large Language Models for Commonsense Reasoning Weiqi Wang Tianqing Fang Chunyang Li Haochen Shi Wenxuan Ding ... Jiaxin Bai Xin Liu Cheng Jiayang Chunkit Chan Yangqiu Song LRM 13 27 0 14 Jan 2024
ChatGPT Evaluation on Sentence Level Relations: A Focus on Temporal, Causal, and Discourse Relations Chunkit Chan Cheng Jiayang Weiqi Wang Yuxin Jiang Tianqing Fang Xin Liu Yangqiu Song LRM 69 60 0 28 Apr 2023
Sparks of Artificial General Intelligence: Early experiments with GPT-4 Sébastien Bubeck Varun Chandrasekaran Ronen Eldan J. Gehrke Eric Horvitz ... Scott M. Lundberg Harsha Nori Hamid Palangi Marco Tulio Ribeiro Yi Zhang ELM AI4MH AI4CE ALM 200 2,232 0 22 Mar 2023
Leveraging Large Language Models for Multiple Choice Question Answering Joshua Robinson Christopher Rytting David Wingate ELM 123 181 0 22 Oct 2022
Large Language Models are Zero-Shot Reasoners Takeshi Kojima S. Gu Machel Reid Yutaka Matsuo Yusuke Iwasawa ReLM LRM 291 2,712 0 24 May 2022
Template-free Prompt Tuning for Few-shot NER Ruotian Ma Xin Zhou Tao Gui Y. Tan Linyang Li Qi Zhang Xuanjing Huang VLM 143 176 0 28 Sep 2021