SeedBench: A Multi-task Benchmark for Evaluating Large Language Models in Seed Science

SeedBench: A Multi-task Benchmark for Evaluating Large Language Models in Seed Science

Annual Meeting of the Association for Computational Linguistics (ACL), 2025

19 May 2025

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "SeedBench: A Multi-task Benchmark for Evaluating Large Language Models in Seed Science"

1 / 1 papers shown

GraphGen: Enhancing Supervised Fine-Tuning for LLMs with Knowledge-Driven Synthetic Data Generation

GraphGen: Enhancing Supervised Fine-Tuning for LLMs with Knowledge-Driven Synthetic Data Generation

189

1

0

26 May 2025