First is Better Than Last for Language Data Influence

First is Better Than Last for Language Data Influence

24 February 2022

Ankur Taly

Mukund Sundararajan

Pradeep Ravikumar

Papers citing "First is Better Than Last for Language Data Influence"

14 / 14 papers shown

Title
Scalable Influence and Fact Tracing for Large Language Model Pretraining Tyler A. Chang Dheeraj Rajagopal Tolga Bolukbasi Lucas Dixon Ian Tenney TDI 33 1 0 22 Oct 2024
Global-to-Local Support Spectrums for Language Model Explainability Lucas Agussurja Xinyang Lu Bryan Kian Hsiang Low FAtt 26 0 0 12 Aug 2024
In2Core: Leveraging Influence Functions for Coreset Selection in Instruction Finetuning of Large Language Models Ayrton San Joaquin Bin Wang Zhengyuan Liu Nicholas Asher Brian Lim Philippe Muller Nancy Chen 34 0 0 07 Aug 2024
When Search Engine Services meet Large Language Models: Visions and Challenges Haoyi Xiong Jiang Bian Yuchen Li Xuhong Li Mengnan Du Shuaiqiang Wang Dawei Yin Sumi Helal 53 28 0 28 Jun 2024
Helpful or Harmful Data? Fine-tuning-free Shapley Attribution for Explaining Language Model Predictions Jingtan Wang Xiaoqiang Lin Rui Qiao Chuan-Sheng Foo Bryan Kian Hsiang Low TDI 35 3 0 07 Jun 2024
What is Your Data Worth to GPT? LLM-Scale Data Valuation with Influence Functions Sang Keun Choe Hwijeen Ahn Juhan Bae Kewen Zhao Minsoo Kang ... Teruko Mitamura Jeff Schneider Eduard Hovy Roger C. Grosse Eric P. Xing TDI 39 28 0 22 May 2024
Training Data Attribution via Approximate Unrolled Differentiation Juhan Bae Wu Lin Jonathan Lorraine Roger C. Grosse TDI MU 51 12 0 20 May 2024
Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective Haoyi Xiong Xuhong Li Xiaofei Zhang Jiamin Chen Xinhao Sun Yuchen Li Zeyi Sun Mengnan Du XAI 37 8 0 09 Jan 2024
Unifying Corroborative and Contributive Attributions in Large Language Models Theodora Worledge Judy Hanwen Shen Nicole Meister Caleb Winston Carlos Guestrin TDI 24 10 0 20 Nov 2023
Massive Editing for Large Language Models via Meta Learning Chenmien Tan Ge Zhang Jie Fu KELM 22 29 0 08 Nov 2023
SoK: Memorisation in machine learning Dmitrii Usynin Moritz Knolle Georgios Kaissis 17 1 0 06 Nov 2023
DoGE: Domain Reweighting with Generalization Estimation Simin Fan Matteo Pagliardini Martin Jaggi 26 30 0 23 Oct 2023
Make Every Example Count: On the Stability and Utility of Self-Influence for Learning from Noisy NLP Datasets Irina Bejan Artem Sokolov Katja Filippova TDI 19 8 0 27 Feb 2023
Training Data Influence Analysis and Estimation: A Survey Zayd Hammoudeh Daniel Lowd TDI 29 82 0 09 Dec 2022