v1v2 (latest)

Two Stones Hit One Bird: Bilevel Positional Encoding for Better Length Extrapolation

29 January 2024

Hongxia Yang

Papers citing "Two Stones Hit One Bird: Bilevel Positional Encoding for Better Length Extrapolation"

15 / 15 papers shown

On the Limitations and Capabilities of Position Embeddings for Length Generalization

Yang Chen

Yitao Liang

Zhouchen Lin

145

05 Oct 2025

HoPE: Hyperbolic Rotary Positional Encoding for Stable Long-Range Dependency Modeling in Large Language Models

198

05 Sep 2025

Position Bias Mitigates Position Bias:Mitigate Position Bias Through Inter-Position Knowledge Distillation

294

21 Aug 2025

Beyond Isolated Capabilities: Bridging Long CoT Reasoning and Long-Context Understanding

Yifei Wang

LRM

166

20 Jul 2025

SAS: Simulated Attention Score

...

302

10 Jul 2025

Sample Complexity and Representation Ability of Test-time Scaling Paradigms

393

05 Jun 2025

Born a Transformer -- Always a Transformer? On the Effect of Pretraining on Architectural Abilities

519

27 May 2025

SoLoPO: Unlocking Long-Context Capabilities in LLMs via Short-to-Long Preference Optimization

...

653

16 May 2025

Context-aware Biases for Length Extrapolation

Ali Veisi

Hamidreza Amirzadeh

Amir Mansourian

637

11 Mar 2025

Rethinking Addressing in Language Models via Contexualized Equivariant Positional Encoding

410

01 Jan 2025

Two are better than one: Context window extension with multi-grained self-injection

Wei Han

Pan Zhou

Soujanya Poria

Shuicheng Yan

243

25 Oct 2024

DAPE V2: Process Attention Score as Feature Map for Length ExtrapolationAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Jing Xiong

...

Michael Ng

Xin Jiang

Zhenguo Li

Yu Li

412

07 Oct 2024

Let the Code LLM Edit Itself When You Edit the Code

Jingjing Xu

314

03 Jul 2024

CAPE: Context-Adaptive Positional Encoding for Length ExtrapolationNeural Information Processing Systems (NeurIPS), 2024

...

Xin Jiang

136

23 May 2024

Training-Free Long-Context Scaling of Large Language Models

Chen An

Fei Huang

Jun Zhang

Shansan Gong

Xipeng Qiu

Chang Zhou

Lingpeng Kong

ALM LRM

352

27 Feb 2024