DeepSeek对于科技和更广义经济的含义是什么?(译)-摩根-202501.pdf

摘要 : DeepSeek是一家中国初创公司,其在2025年1月28日发布了两款模型DeepSeek-R1-zero和DeepSeek-R1,这两款模型探索了在没有监督数据的情况下发展大型语言模型(LLM)推理能力的潜力,重点在于通过强化学习实现自我进化。DeepSeek的模型显示了训练GenAI模型成本的大幅下降,这对于科技和经济有重大影响。随着成本的降低,预计美国科技巨头将在2025/2026年投入约6500亿美元用于资本支出,推动GenAI产品的创新和可用性。此外,计算成本的下降和使用渗透率的上升预计将推动互联网和软件行业的GenAIROIC提高。DeepSeek-v3模型基于280万H800GPU小时的计算资源进行了估计560万美元的训练,远低于训练MetaLlama3405B所需的成本。这一成本降低将推动LLM的创新、消费者和企业采用,以及提升生成式AI的ROIC和经济生产力。摩根士丹利的研究强调了成本下降对GenAI早期采用和扩散的影响,以及对出口管制和LLM商品化的担忧。
在线阅读 下载报告 | 2.05 MB | 70页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告
与最强人工智能Ai对话