Project

General

Profile

分布式相关 » History » Version 3

jun chen, 07/26/2025 05:53 PM

1 1 jun chen
# 分布式相关
2
3
从softmax到context parallell
4
5
针对超长上下文模型训练的序列并行方案简介
6 2 jun chen
7
deepspeed-zero3 分享
8 3 jun chen
9
|A |B |
10
|--|--|
11
| 综合课程 | https://github.com/gpu-mode/lectures?tab=readme-ov-file |
12
| 综合课程 |  https://llmsystem.github.io/llmsystem2024spring/docs/Syllabus/ |
13
| 纯 NLP   |  https://princeton-nlp.github.io/cos484/ |
14
| 综合课程 | https://hao-ai-lab.github.io/cse234-w25/index.html https://hao-ai-lab.github.io/dsc291-s24/ |