BERTScore: Evaluating Text Generation with BERT

21 April 2019

Papers citing "BERTScore: Evaluating Text Generation with BERT"

50 / 758 papers shown

Title
ProteinGPT: Multimodal LLM for Protein Property Prediction and Structure Understanding Yijia Xiao Edward Sun Yiqiao Jin Qifan Wang Wei Wang 40 9 0 21 Aug 2024
Vocabulary-Free 3D Instance Segmentation with Vision and Language Assistant Guofeng Mei Luigi Riz Yiming Wang Fabio Poiesi ISeg VLM 59 3 0 20 Aug 2024
What can Large Language Models Capture about Code Functional Equivalence? Nickil Maveli Antonio Vergari Shay B. Cohen 27 2 0 20 Aug 2024
Ex3: Automatic Novel Writing by Extracting, Excelsior and Expanding Lei Huang Jiaming Guo Guanhua He Xishan Zhang Rui Zhang Shaohui Peng Shaoli Liu Tianshi Chen 20 2 0 16 Aug 2024
AdTEC: A Unified Benchmark for Evaluating Text Quality in Search Engine Advertising Peinan Zhang Yusuke Sakai Masato Mita Hiroki Ouchi Taro Watanabe 49 0 0 12 Aug 2024
Diffusion Guided Language Modeling Justin Lovelace Varsha Kishore Yiwei Chen Kilian Q. Weinberger 36 6 0 08 Aug 2024
Human Speech Perception in Noise: Can Large Language Models Paraphrase to Improve It? Anupama Chingacham Miaoran Zhang Vera Demberg Dietrich Klakow 33 0 0 07 Aug 2024
StyEmp: Stylizing Empathetic Response Generation via Multi-Grained Prefix Encoder and Personality Reinforcement Yahui Fu Chenhui Chu Tatsuya Kawahara 29 2 0 05 Aug 2024
Self-Emotion Blended Dialogue Generation in Social Simulation Agents Qiang Zhang Jason Naradowsky Yusuke Miyao 16 2 0 03 Aug 2024
Learning Video Context as Interleaved Multimodal Sequences S. Shao Pengchuan Zhang Y. Li Xide Xia A. Meso Ziteng Gao Jinheng Xie N. Holliman Mike Zheng Shou 41 5 0 31 Jul 2024
MindSpeech: Continuous Imagined Speech Decoding using High-Density fNIRS and Prompt Tuning for Advanced Human-AI Interaction Suyi Zhang Ekram Alam Jack Baber Francesca Bianco Edward Turner Maysam Chamanzar Hamid Dehghani 23 0 0 25 Jul 2024
Learn while Unlearn: An Iterative Unlearning Framework for Generative Language Models Haoyu Tang Ye Liu Xukai Liu Xukai Liu Yanghai Zhang Kai Zhang Xiaofang Zhou Enhong Chen MU 62 3 0 25 Jul 2024
SETTP: Style Extraction and Tunable Inference via Dual-level Transferable Prompt Learning Chunzhen Jin Yongfeng Huang Yaqi Wang Peng Cao Osmar Zaiane VLM 29 1 0 22 Jul 2024
UF-HOBI at "Discharge Me!": A Hybrid Solution for Discharge Summary Generation Through Prompt-based Tuning of GatorTronGPT Models Mengxian Lyu C.A.I. Peng Daniel Paredes Ziyi Chen Aokun Chen Jiang Bian Yonghui Wu 19 2 0 22 Jul 2024
Fact-Aware Multimodal Retrieval Augmentation for Accurate Medical Radiology Report Generation Liwen Sun James Zhao Megan Han Chenyan Xiong MedIm 45 7 0 21 Jul 2024
Impact of Model Size on Fine-tuned LLM Performance in Data-to-Text Generation: A State-of-the-Art Investigation Joy Mahapatra Utpal Garain 29 8 0 19 Jul 2024
Rethinking Transformer-based Multi-document Summarization: An Empirical Investigation Congbo Ma Wei Emma Zhang Dileepa Pitawela Haojie Zhuang Yanfeng Shu 19 0 0 16 Jul 2024
SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers Shraman Pramanick Rama Chellappa Subhashini Venugopalan 43 13 0 12 Jul 2024
DAHRS: Divergence-Aware Hallucination-Remediated SRL Projection Sangpil Youm Brodie Mather Chathuri Jayaweera Juliana Prada Bonnie J. Dorr VLM 38 0 0 12 Jul 2024
Merge, Ensemble, and Cooperate! A Survey on Collaborative Strategies in the Era of Large Language Models Jinliang Lu Ziliang Pang Min Xiao Yaochen Zhu Rui Xia Jiajun Zhang MoMe 29 18 0 08 Jul 2024
Generation and De-Identification of Indian Clinical Discharge Summaries using LLMs Sanjeet Singh Shreya Gupta Niralee Gupta Naimish Sharma Lokesh Srivastava Vibhu Agarwal Ashutosh Modi 18 0 0 08 Jul 2024
InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation Gaurav Sahu Abhay Puri Juan A. Rodriguez Alexandre Drouin Perouz Taslakian ... Christopher Pal Nicolas Chapados I. Laradji Sai Rajeswar Mudumba Issam Hadj Laradji ELM 37 4 0 08 Jul 2024
Exposing Privacy Gaps: Membership Inference Attack on Preference Data for LLM Alignment Qizhang Feng Siva Rajesh Kasa Santhosh Kumar Kasa Hyokun Yun C. Teo S. Bodapati 84 6 0 08 Jul 2024
On Speeding Up Language Model Evaluation Jin Peng Zhou Christian K. Belardi Ruihan Wu Travis Zhang Carla P. Gomes Wen Sun Kilian Q. Weinberger 48 1 0 08 Jul 2024
IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoning Abhinav Joshi Shounak Paul Akshat Sharma Pawan Goyal Saptarshi Ghosh Ashutosh Modi AILaw ELM 21 7 0 07 Jul 2024
MINDECHO: Role-Playing Language Agents for Key Opinion Leaders Rui Xu Dakuan Lu Xiaoyu Tan Xintao Wang Siyu Yuan Jiangjie Chen Wei Chu Xu Yinghui LLMAG 29 3 0 07 Jul 2024
Faux Polyglot: A Study on Information Disparity in Multilingual Large Language Models Nikhil Sharma Kenton Murray Ziang Xiao 50 1 0 07 Jul 2024
FlowLearn: Evaluating Large Vision-Language Models on Flowchart Understanding Huitong Pan Qi Zhang Cornelia Caragea Eduard Constantin Dragut Longin Jan Latecki 33 4 0 06 Jul 2024
MedPix 2.0: A Comprehensive Multimodal Biomedical Data set for Advanced AI Applications Irene Siragusa Salvatore Contino Massimo La Ciura Rosario Alicata Roberto Pirrone 52 3 0 03 Jul 2024
FineSurE: Fine-grained Summarization Evaluation using LLMs Hwanjun Song Hang Su Igor Shalyminov Jason (Jinglun) Cai Saab Mansour HILM 26 29 0 01 Jul 2024
From Introspection to Best Practices: Principled Analysis of Demonstrations in Multimodal In-Context Learning Nan Xu Fei Wang Sheng Zhang Hoifung Poon Muhao Chen 32 6 0 01 Jul 2024
Cross-Lingual Transfer Learning for Speech Translation Rao Ma Yassir Fathullah Mengjie Qian Siyuan Tang Mark J. F. Gales Kate Knill 18 1 0 01 Jul 2024
IDT: Dual-Task Adversarial Attacks for Privacy Protection Pedro Faustini Shakila Mahjabin Tonni Annabelle McIver Qiongkai Xu Mark Dras SILM AAML 33 0 0 28 Jun 2024
CMMaTH: A Chinese Multi-modal Math Skill Evaluation Benchmark for Foundation Models Zhong-Zhi Li Ming-Liang Zhang Fei Yin Zhi-Long Ji Jin-Feng Bai Zhen-Ru Pan Fan-Hu Zeng Jian Xu Jia-Xin Zhang Cheng-Lin Liu ELM 25 10 0 28 Jun 2024
Are Generative Language Models Multicultural? A Study on Hausa Culture and Emotions using ChatGPT Ibrahim Said Ahmad Shiran Dudy R. Ramachandranpillai Kenneth Church 26 4 0 27 Jun 2024
PaCoST: Paired Confidence Significance Testing for Benchmark Contamination Detection in Large Language Models Huixuan Zhang Yun Lin Xiaojun Wan 40 0 0 26 Jun 2024
On the Transformations across Reward Model, Parameter Update, and In-Context Prompt Deng Cai Huayang Li Tingchen Fu Siheng Li Weiwen Xu ... Leyang Cui Yan Wang Lemao Liu Taro Watanabe Shuming Shi KELM 26 2 0 24 Jun 2024
AND: Audio Network Dissection for Interpreting Deep Acoustic Models Tung-Yu Wu Yu-Xiang Lin Tsui-Wei Weng 43 1 0 24 Jun 2024
LLMs Assist NLP Researchers: Critique Paper (Meta-)Reviewing Jiangshu Du Yibo Wang Wenting Zhao Zhongfen Deng Shuaiqi Liu ... Eduardo Blanco Yixin Cao Rui Zhang Philip S. Yu Wenpeng Yin 52 25 0 24 Jun 2024
PlagBench: Exploring the Duality of Large Language Models in Plagiarism Generation and Detection Jooyoung Lee Toshini Agrawal Adaku Uchendu Thai V. Le Jinghui Chen Dongwon Lee 21 1 0 24 Jun 2024
Do LLMs Have Distinct and Consistent Personality? TRAIT: Personality Testset designed for LLMs with Psychometrics Seungbeen Lee Seungwon Lim Seungju Han Giyeong Oh Hyungjoo Chae ... Beong-woo Kwak Yeonsoo Lee Dongha Lee Jinyoung Yeo Youngjae Yu 33 8 0 20 Jun 2024
Extrinsic Evaluation of Cultural Competence in Large Language Models Shaily Bhatt Fernando Diaz ELM EGVM 47 4 0 17 Jun 2024
Improving Adversarial Robustness via Decoupled Visual Representation Masking Decheng Liu Tao Chen Chunlei Peng Nannan Wang Ruimin Hu Xinbo Gao AAML 38 1 0 16 Jun 2024
SciEx: Benchmarking Large Language Models on Scientific Exams with Human Expert Grading and Automatic Grading Tu Anh Dinh Carlos Mullov Leonard Barmann Zhaolin Li Danni Liu ... Michael Beigl Rainer Stiefelhagen Carsten Dachsbacher Klemens Bohm Jan Niehues ELM 35 8 0 14 Jun 2024
Inclusive ASR for Disfluent Speech: Cascaded Large-Scale Self-Supervised Learning with Targeted Fine-Tuning and Data Augmentation Dena F. Mujtaba N. Mahapatra Megan Arney J Scott Yaruss Caryn Herring Jia Bin 29 1 0 14 Jun 2024
A Survey on Large Language Models from General Purpose to Medical Applications: Datasets, Methodologies, and Evaluations Jinqiang Wang Huansheng Ning Yi Peng Qikai Wei Daniel Tesfai Wenwei Mao Tao Zhu Runhe Huang LM&MA AI4MH ELM 36 4 0 14 Jun 2024
A Concept-Based Explainability Framework for Large Multimodal Models Jayneel Parekh Pegah Khayatan Mustafa Shukor A. Newson Matthieu Cord 32 16 0 12 Jun 2024
Languages Transferred Within the Encoder: On Representation Transfer in Zero-Shot Multilingual Translation Zhi Qu Chenchen Ding Taro Watanabe 75 1 0 12 Jun 2024
Textual Similarity as a Key Metric in Machine Translation Quality Estimation Kun Sun Rong Wang 19 1 0 11 Jun 2024
Evaluating the Retrieval Component in LLM-Based Question Answering Systems Ashkan Alinejad Krtin Kumar Ali Vahdat 49 5 0 10 Jun 2024