DeepSeek原理与效应-天津大学-202502.pdf

摘要 : 本文是关于天津大学自然语言处理实验室的深度解读报告,主题为DeepSeek的原理与效应。报告分为四个部分:伏羲传语大语言模型发展路线图、技术原理、DeepSeek效应和未来展望。报告回顾了生成式AI的发展历程,从1945年的ENIAC到2014年的Attention机制,再到2017年的Transformer架构,以及2020年的Scaling Laws和GPT-3,2022年的RLHF和ChatGPT,预计到2024年将发展到o1/R1阶段。报告还提到了AI历史上的两次寒冬,并强调了生成式AI在生成各类数据(语言、语音、图片、视频等)中的作用,以及Attention、Transformer、Scaling Laws和RLHF在数据生成和学习中的重要性。最后,报告提出了对未来AI发展的展望。
在线阅读 下载报告 | 7.72 MB | 44页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告
与最强人工智能Ai对话