DeepSeek模型优势：算力、成本角度解读-浙江大学-202502.pdf下载

DeepSeek模型优势：算力、成本角度解读-浙江大学-202502.pdf

这份文档是关于DeepSeek模型优势，算力和成本角度的解读。主要内容如下：

1. 算力基础概念：

算力是对信息数据进行计算，实现目标结果的能力。
算力发展经历了从大脑、草绳石子、算盘算筹到计算机的发展历程。
计算机算力发展：从大型机时代、PC时代、云计算时代到人工智能时代。
人工智能大模型算力估计: 数据量(D) > 15 *模型参数量(N)；通过公式估算万亿模型需要消耗的算力。

2. 人工智能计算平台成本估计：

比较了华为910B和英伟达H800的算力、显存、运力等指标和成本。
对万亿大模型预训练系统成本进行估计，说明了训练所需的计算量和时间。

3. 大模型指导法则 Scaling Law：

算力、数据集、模型参数量越大，模型效果越好。

4. OpenAI商业模式（以及与国内人工智能的对比）：

OpenAI的商业模式：华尔街融资、购买最新GPU、用最新GPU训练性能领先的大模型、用训练的GPU给客户提供高质量模型服务。
分析了国内人工智能商业模式与OpenAI的异同，以及国内人工智能的可行性分析。

5. 美国限制中国AI发展的策略：

指出美国通过限制GPU等手段限制中国AI发展。

6. DeepSeek的应对和未来展望：

阐述了算力卡脖子的时代背景，以及DeepSeek等国内大模型在“上甘岭”时刻面临的挑战。
通过技术创新（如DeepSeekMoE、MLA）和系统优化（自研轻量级框架）来应对算力限制，降低成本。
展示了DeepSeek V3的单次极低预训练成本和发展历程。
对DeepSeek的未来进行展望，包括模型性能、成本、算力等方面。重点突出通过“战术穿插”+“火力覆盖”，以及突破工艺卡脖子，最终实现人工智能的赶超。

DeepSeek模型优势：算力、成本角度解读-浙江大学-202502.pdf

相关报告

8.36 MB 76页 DeepSeek R1+Kimi1.5及类强推理模型开发解读-北京大学-202502.pdf

6.95 MB 81页 2025从DeepSeek探讨大语言模型在建筑及能源行业的应用趋势和技术方法报告-浙江大学-202502.pdf

10.65 MB 65页浙江大学·DeepSeek手册Ⅷ《DeepSeek模型解读》.pdf

13.36 MB 71页 DeepSeek：智能时代的全面到来和人机协作的新常态-浙江大学-202502.pdf

42.68 MB 52页 DeepSeek：回望AI三大主义与加强通识教育-浙江大学-202502.pdf

128.1 MB 86页 Chatting or Acting——-DeepSeek的突破边界与“浙大先生”的未来图景-浙江大学-202502.pdf

4.87 MB 153页 2025年DeepSeek行业应用案例集——解锁智能变革密码-浙江大学-202502.pdf

6.71 MB 55页 DeepSeek模型本地部署与应用构建-清华大学-202502.pdf

4.37 MB 50页 DeepSeek技术溯源及前沿探索-浙江大学-202503.pdf

13.08 MB 61页从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例-浙江大学-202503.pdf

781.28 KB 30页大语言模型在投研中的应用：DeepSeek、QwQ-32B与Manus技术解析、投研场景与量化应用-太平洋证券-202503.pdf

38.77 MB 57页 DeepSeek的本地化部署与AI通识教育之未来-浙江大学-202503.pdf

8.73 MB 56页 DeepSeek之火，可以燎原-浙江大学-202503.pdf

4.24 MB 10页走向数字社会：从Deepseek到群体智慧-浙江大学-202503.pdf

10.43 MB 48页深度解读DeepSeek：部署、使用、安全-天津大学-202503.pdf

49.96 MB 258页 DeepSeek企业落地应用讲义精华全版-大任智库-202502.pdf

16.73 MB 117页 2025年DeepSeek完全实用手册V1.0——从技术原理到使用技巧-至顶AI实验室-202502.pdf

5.02 MB 76页【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502.pdf

18.43 MB 86页 DeepSeek内部研讨系列：DeepSeek提示词工程和落地场景-北京大学-202502.pdf

11.47 MB 98页 DeepSeek内部研讨系列：DeepSeek与AIGC应用-北京大学-202502.pdf

DeepSeek模型优势：算力、成本角度解读-浙江大学-202502.pdf

相关报告

8.36 MB 76页 DeepSeek R1+Kimi1.5及类强推理模型开发解读-北京大学-202502.pdf

6.95 MB 81页 2025从DeepSeek探讨大语言模型在建筑及能源行业的应用趋势和技术方法报告-浙江大学-202502.pdf

10.65 MB 65页 浙江大学·DeepSeek手册Ⅷ《DeepSeek模型解读》.pdf

13.36 MB 71页 DeepSeek：智能时代的全面到来和人机协作的新常态-浙江大学-202502.pdf

42.68 MB 52页 DeepSeek：回望AI三大主义与加强通识教育-浙江大学-202502.pdf

128.1 MB 86页 Chatting or Acting——-DeepSeek的突破边界与“浙大先生”的未来图景-浙江大学-202502.pdf

4.87 MB 153页 2025年DeepSeek行业应用案例集——解锁智能变革密码-浙江大学-202502.pdf

6.71 MB 55页 DeepSeek模型本地部署与应用构建-清华大学-202502.pdf

4.37 MB 50页 DeepSeek技术溯源及前沿探索-浙江大学-202503.pdf

13.08 MB 61页 从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例-浙江大学-202503.pdf

781.28 KB 30页 大语言模型在投研中的应用：DeepSeek、QwQ-32B与Manus技术解析、投研场景与量化应用-太平洋证券-202503.pdf

38.77 MB 57页 DeepSeek的本地化部署与AI通识教育之未来-浙江大学-202503.pdf

8.73 MB 56页 DeepSeek之火，可以燎原-浙江大学-202503.pdf

4.24 MB 10页 走向数字社会：从Deepseek到群体智慧-浙江大学-202503.pdf

10.43 MB 48页 深度解读DeepSeek：部署、使用、安全-天津大学-202503.pdf

49.96 MB 258页 DeepSeek企业落地应用讲义精华全版-大任智库-202502.pdf

16.73 MB 117页 2025年DeepSeek完全实用手册V1.0——从技术原理到使用技巧-至顶AI实验室-202502.pdf

5.02 MB 76页 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502.pdf

18.43 MB 86页 DeepSeek内部研讨系列：DeepSeek提示词工程和落地场景-北京大学-202502.pdf

11.47 MB 98页 DeepSeek内部研讨系列：DeepSeek与AIGC应用-北京大学-202502.pdf

10.65 MB 65页浙江大学·DeepSeek手册Ⅷ《DeepSeek模型解读》.pdf

13.08 MB 61页从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例-浙江大学-202503.pdf

781.28 KB 30页大语言模型在投研中的应用：DeepSeek、QwQ-32B与Manus技术解析、投研场景与量化应用-太平洋证券-202503.pdf

4.24 MB 10页走向数字社会：从Deepseek到群体智慧-浙江大学-202503.pdf

10.43 MB 48页深度解读DeepSeek：部署、使用、安全-天津大学-202503.pdf

5.02 MB 76页【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502.pdf