【AI比赛教程|2021年CCF 基于BERT的大模型容量挑战赛 第一名方案分享】??第一名队伍为北京大学河图实习生队,下面将详细介绍该冠军团队的解决方案。
文章目录
- 1. 团队介绍
- 2. 赛题背景
-
- 2.1 趋势一:深度学习模型规模日益增长
- 2.2 趋势二:大模型训练代价难以负担,成本高居不下
- 3. 比赛任务
- 4. 解决方案
-
- 4.1 模型显存分析
- 4.2 优化1:调整计算顺序
- 4.3 优化2:层间融合
- 4.4 优化3∶层内内存复用( Memory-Reuse Intra Layer )
- 5. 分布式训练方案
-
- 5.1 数据并行(Data Parallel)
- 5.2 层内模型并行(Tensor Model Parallel)
- 5.3 层间模型并行(Layer Model Parallel)
- 6. 总结
推荐阅读
- 人脸识别|Yolo利息的王者(高效且更精确的目标检测框架(附源代码))
- 人脸识别|Yolo的巅峰框架(高效更精确的目标检测框架(附源代码))
- 人脸识别|Yolo系列的巅峰之作(更确的目标检测框架(附源代码))
- 蒸馏|Learning without Forgetting 详解(LwF)
- 人工智能|实时换脸技术——直播,视频通话|脸部交换程序
- 深度学习|真正的AI实时换脸技术——可用于直播换脸带货
- 人工智能|人工智能---深度学习从感知机到神经网络
- 机器学习|深度学习中优化方法
- 睿智的目标检测|睿智的目标检测55——Keras搭建YoloV5目标检测平台