Investigating Efficiently Extending Transformers for Long Input
Summarization

Investigating Efficiently Extending Transformers for Long Input Summarization

8 August 2022

Papers citing "Investigating Efficiently Extending Transformers for Long Input Summarization"

14 / 14 papers shown

Title
DiscoGraMS: Enhancing Movie Screen-Play Summarization using Movie Character-Aware Discourse Graph Maitreya Prafulla Chitale Uday Bindal Rajakrishnan Rajkumar Rahul Mishra 19 0 0 18 Oct 2024
Can Large Language Model Summarizers Adapt to Diverse Scientific Communication Goals? Marcio Fonseca Shay B. Cohen 39 10 0 18 Jan 2024
PELMS: Pre-training for Effective Low-Shot Multi-Document Summarization Joseph Peper Wenzhao Qiu Lu Wang 23 0 0 16 Nov 2023
Evaluation Metrics in the Era of GPT-4: Reliably Evaluating Large Language Models on Sequence to Sequence Tasks Andrea Sottana Bin Liang Kai Zou Zheng Yuan ALM ELM LM&MA 25 54 0 20 Oct 2023
Topic-Guided Self-Introduction Generation for Social Media Users Chunpu Xu Jing Li Pijian Li Min Yang 21 0 0 24 May 2023
SCM: Enhancing Large Language Model with Self-Controlled Memory Framework Bin Wang Xinnian Liang Jian Yang Huijia Huang Shuangzhi Wu Peihao Wu Lu Lu Zejun Ma Zhoujun Li LLMAG KELM RALM 94 25 0 26 Apr 2023
Composer's Assistant: An Interactive Transformer for Multi-Track MIDI Infilling Martin E. Malandro 22 6 0 29 Jan 2023
On the State of German (Abstractive) Text Summarization Dennis Aumiller Jing Fan Michael Gertz 16 1 0 17 Jan 2023
DIONYSUS: A Pre-trained Model for Low-Resource Dialogue Summarization Yu Li Baolin Peng Pengcheng He Michel Galley Zhou Yu Jianfeng Gao 19 7 0 20 Dec 2022
Adapting Pretrained Text-to-Text Models for Long Text Sequences Wenhan Xiong Anchit Gupta Shubham Toshniwal Yashar Mehdad Wen-tau Yih RALM VLM 49 30 0 21 Sep 2022
SQuALITY: Building a Long-Document Summarization Dataset the Hard Way Alex Jinpeng Wang Richard Yuanzhe Pang Angelica Chen Jason Phang Samuel R. Bowman 72 44 0 23 May 2022
Train Short, Test Long: Attention with Linear Biases Enables Input Length Extrapolation Ofir Press Noah A. Smith M. Lewis 245 695 0 27 Aug 2021
Big Bird: Transformers for Longer Sequences Manzil Zaheer Guru Guruganesh Kumar Avinava Dubey Joshua Ainslie Chris Alberti ... Philip Pham Anirudh Ravula Qifan Wang Li Yang Amr Ahmed VLM 251 2,009 0 28 Jul 2020
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 226 4,453 0 23 Jan 2020