v1v2v3 (latest)

A Comprehensive Evaluation of Large Language Models on Benchmark Biomedical Text Processing Tasks

6 October 2023

Fangshuo Liao

Md Tahmid Rahman Laskar

ArXiv (abs)PDF HTML Github (7★)

Papers citing "A Comprehensive Evaluation of Large Language Models on Benchmark Biomedical Text Processing Tasks"

31 / 31 papers shown

Conversational No-code, Multi-agentic Disease Module Identification and Drug Repurposing Prediction with ChatDRex

Fernando M. Delgado-Chaves

170

26 Nov 2025

BanglaMedQA and BanglaMMedBench: Evaluating Retrieval-Augmented Generation Strategies for Bangla Biomedical Question Answering

Sadia Sultana

Saiyma Sittul Muna

Mosammat Zannatul Samarukh

Ajwad Abrar

Tareque Mohmud Chowdhury

RALM

256

06 Nov 2025

DACIP-RC: Domain Adaptive Continual Instruction Pre-Training via Reading Comprehension on Business Conversations

Elena Khasanova

Harsh Saini

Md Tahmid Rahman Laskar

143

09 Oct 2025

RELATE: Relation Extraction in Biomedical Abstracts with LLMs and Ontology Constraints

121

23 Sep 2025

Toward Better EHR Reasoning in LLMs: Reinforcement Learning with Expert Attention Guidance

...

225

19 Aug 2025

Improving Automatic Evaluation of Large Language Models (LLMs) in Biomedical Relation Extraction via LLMs-as-the-JudgeAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Md Tahmid Rahman Laskar

217

01 Jun 2025

Ontology- and LLM-based Data Harmonization for Federated Learning in Healthcare

248

26 May 2025

Performance Evaluation of Large Language Models in Bangla Consumer Health Query Summarization

422

08 May 2025

EvidenceBench: A Benchmark for Extracting Evidence from Biomedical Papers

...

361

25 Apr 2025

Classification of User Reports for Detection of Faulty Computer Components using NLP Models: A Case Study

Maria de Lourdes M. Silva

182

20 Mar 2025

Can Frontier LLMs Replace Annotators in Biomedical Text Mining? Analyzing Challenges and Exploring Solutions

Yichong Zhao

Susumu Goto

316

05 Mar 2025

Position: Beyond Assistance - Reimagining LLMs as Ethical and Adaptive Co-Creators in Mental Health Care

Abeer Badawi

Md Tahmid Rahman Laskar

313

21 Feb 2025

ChemSafetyBench: Benchmarking LLM Safety on Chemistry Domain

...

281

23 Nov 2024

AfriMed-QA: A Pan-African, Multi-Specialty, Medical Question-Answering Benchmark DatasetAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

...

Mercy Nyamewaa Asiedu

LM&MA

912

23 Nov 2024

Zodiac: A Cardiologist-Level LLM Framework for Multi-Agent Diagnostics

Yiwen Lu

Yong Chen

176

02 Oct 2024

Assessing and Enhancing Large Language Models in Rare Disease Question-answering

Chia-Yuan Chang

Vladimir Braverman

Xia Hu

268

15 Aug 2024

Stochastic Parrots or ICU Experts? Large Language Models in Critical Care Medicine: A Scoping Review

254

27 Jul 2024

A Systematic Survey and Critical Review on Evaluating Large Language Models: Challenges, Limitations, and Recommendations

Md Tahmid Rahman Laskar

Sawsan Alqahtani

M Saiful Bari

Mizanur Rahman

Mohammad Abdullah Matin Khan

...

Enamul Hoque

Jimmy Huang

317

110

04 Jul 2024

Evaluation of Language Models in the Medical Context Under Resource-Constrained Settings

267

24 Jun 2024

Large Language Models in the Clinic: A Comprehensive Benchmark

342

25 Apr 2024

A Comprehensive Survey on Evaluating Large Language Model Applications in the Medical Industry

520

24 Apr 2024

Unveiling LLM Evaluation Focused on Metrics: Challenges and Solutions

Taojun Hu

Xiao-Hua Zhou

ELM

373

14 Apr 2024

Bioinformatics and Biomedical Informatics with ChatGPT: Year One Review

399

22 Mar 2024

RAmBLA: A Framework for Evaluating the Reliability of LLMs as Assistants in the Biomedical Domain

William James Bolton

Rafael Poyiadzi

Edward R. Morrell

Gabriela van Bergen Gonzalez Bueno

Lea Goetz

289

21 Mar 2024

Leveraging Biomolecule and Natural Language through Multi-Modal Learning: A Survey

545

03 Mar 2024

Reading Subtext: Evaluating Large Language Models on Short Story Summarization with Writers

Melanie Subbiah

Sean Zhang

Lydia B. Chilton

Kathleen McKeown

449

02 Mar 2024

Biomedical Entity Linking as Multiple Choice Question Answering

439

23 Feb 2024

An Evaluation of Large Language Models in Bioinformatics Research

Hengchuang Yin

Zhonghui Gu

Fanhao Wang

Yiparemu Abuduhaibaier

Xiao Luo

275

21 Feb 2024

Tiny Titans: Can Smaller Large Language Models Punch Above Their Weight in the Real World for Meeting Summarization?

Xue-Yong Fu

Md Tahmid Rahman Laskar

339

01 Feb 2024

A comparative study of zero-shot inference with large language models and supervised modeling in breast cancer pathology classificationResearch Square (RS), 2024

332

25 Jan 2024

BenLLMEval: A Comprehensive Evaluation into the Potentials and Pitfalls of Large Language Models on Bengali NLPInternational Conference on Language Resources and Evaluation (LREC), 2023

M. Kabir

Mohammed Saidul Islam

Md Tahmid Rahman Laskar

391

22 Sep 2023