计算机行业华为系列深度之十八暨GenAI系列深度之四十九:算力新变局,训练范式、架构创新、工程优化-申万宏源-20250207.pdf

本报告主要关注算力新变局下的训练范式、架构创新和工程优化,并对AI大模型的发展趋势进行深入分析。
**核心观点:**
* **算力需求持续增长:** 随着AI大模型训练范式转向多阶段(预训练、后训练和推理),强化学习及推理阶段的算力投入将持续提升。模型架构创新和工程优化可以降低训推成本。开源和蒸馏等普惠趋势下,算力总量需求仍将乐观。
* **训练范式转变:** AI发展遵循三大Scaling Law(规模定律):预训练、后训练和推理,其中后训练和推理阶段的重要性逐渐提升,这推动了对算力需求的增长,尤其是后训练阶段的强化学习及推理阶段。
* **模型架构创新:** MoE 混合专家模型、线性/稀疏注意力机制等技术可以降低训练成本,优化推理效率。Deepseek V3 和 R1 模型的成功,也佐证了后训练和推理阶段的重要性。
* **工程优化:** Deepseek V3 在训练和推理方面进行了深度优化,有效降低了算力成本和时间。
* **开源与蒸馏:** 开源和蒸馏技术正在推动AI模型的普及,降低了使用门槛,同时也可能加速杰文斯悖论的发生,从而促进对算力的需求。
* **市场动态:** 海内外大厂都在加大资本开支,如微软、Meta、谷歌等,国内厂商也在积极跟进。同时,国产算力在性能和生态方面取得了突破,如海光信息、华为昇腾等,有望形成与英伟达竞争的“第二极”。
* **投资建议:** 报告建议关注浪潮信息、神州数码、紫光股份、海光信息、泰嘉股份、澜起科技、中芯国际、盛科通信-U、烽火通信、中兴通讯等公司。
**风险提示:** 技术路线不确定性、研发进展不及预期、供应链稳定风险、竞争加剧风险。
相关报告
-
1.67 MB 23页 申万宏源-计算机行业AIGC系列之七:国产AI芯片的百倍算力需求!-230324.pdf
-
1.5 MB 34页 见微知著系列专题之四:新消费,“新”在哪里?-申万宏源-250324.pdf
-
2.34 MB 13页 申万宏源-计算机行业AIGC系列之九:阿里大模型,统一底座滋养多模态之花-230329.pdf
-
840.01 KB 12页 “天工”系列专题之四:隐秘的角落,小企业景气恢复-申万宏源-20240419.pdf
-
1.16 MB 31页 外循环“破局”系列之一:30图看懂中国对外投资新变化-申万宏源-20230420.pdf
-
1.63 MB 13页 AI行业系列点评:ChatGPTAIGC九问九答-申万宏源-20230206.pdf
-
2.8 MB 43页 20210401-【申万宏源】口碑领先IT职业培训龙头,抢滩AI时代新机遇.pdf
-
2.79 MB 43页 茶饮行业深度报告系列之一:品牌+渠道共创茶饮行业千亿市场-申万宏源-20210218.pdf
-
13.99 MB 72页 AI赋能出海营销的创新与转变-OneSight-202504.pdf
-
1.22 MB 18页 AI变革行业创新发展:2025中国金融行业大模型产业洞察-金融智慧升级,大模型赋能未来.pdf
-
2.42 MB 26页 “应对低生育”系列二:应对低生育,海外经验与我国特征-申万宏源-250325.pdf
-
947.44 KB 19页 “应对低生育”系列一:育儿补贴,进展及影响?-申万宏源-250318.pdf
-
8.54 MB 34页 特朗普2.0宏观形势展望:夜半临深池-申万宏源-20250312.pdf
-
8.67 MB 89页 Manus AI智能体:AGI发展新范式的实践与测评-智昇人工智能研究院-202503.pdf
-
3.01 MB 10页 计算机行业Grok 3:RL成为共识,持续看好预训练算力需求-华泰证券-20250219.pdf
-
20.76 MB 52页 计算机行业人工智能系列深度报告:DeepSeek研究框架-国海证券-20250214.pdf
-
22.67 MB 52页 Agent如何重构软件生态?-申万宏源-20250206.pdf