Bio
Papers
Experience
Projects
Teaching

Projects
Experience
Blog
Publications
Recent & Upcoming Talks
- Example Talk
Teaching

MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation

Jan 1, 2024·

Lu Li

,

Tianyu Zhang

,

Zhiqi Bu

,

Suyuchen Wang

,

Huan He

,

Jie Fu

,

Yonghui Wu

,

Jiang Bian

,

Yong Chen

,

Yoshua Bengio

· 0 min read

Type

Journal article

Publication

CoRR

Last updated on Nov 11, 2024

← LongRecipe: Recipe for Efficient Long Context Generalization in Large Language Models Jan 1, 2024

Resonance RoPE: Improving Context Length Generalization of Large Language Models Jan 1, 2024 →

© 2024 Suyuchen Wang. This webpage is licensed under CC BY NC ND 4.0

Published with Hugo Blox Builder — the free, open source website builder that empowers creators.