Project

General

Profile

分布式相关 » History » Version 2

jun chen, 07/26/2025 05:18 PM

1 1 jun chen
# 分布式相关
2
3
从softmax到context parallell
4
5
针对超长上下文模型训练的序列并行方案简介
6 2 jun chen
7
deepspeed-zero3 分享