2025我们该如何看待DeepSeek——what, how, why, and next-湖南大学-202502.pdf

该文档是湖南大学陈果教授关于DeepSeek大模型的报告,主要探讨了如何看待DeepSeek,包括其是什么(What),如何使用(How),为何有效(Why)以及未来发展(Next)。
1. **DeepSeek是什么:**
* DeepSeek是继ChatGPT后又一引爆AI领域的大模型,它以文字接龙的方式工作,通过学习大量文本来预测下一个token。
* OpenAI的o1是推理大模型,强调“思维链”过程,提升了数学逻辑和推理能力。
* 推理模型(Reasoning LLMs)与普通模型(Regular LLMs)的区别在于推理模型会经过多个思考过程(Thought process)再给出答案。
* DeepSeek R1相较于其他模型,具有“屠夫”般的价格优势、开源、推理能力强等特点,使得AI技术能够走进千家万户。
2. **如何使用DeepSeek:**
* DeepSeek可以通过官网、秘塔搜索、360纳米AI搜索等方式使用。
* 调用DeepSeek服务有普通调用和文件+联网搜索(RAG)两种方式,RAG可以提供更精准的回答。
* 掌握Prompt、Token、上下文长度等术语的概念有助于更好地使用DeepSeek。
* 要正确理解DeepSeek的能力,发挥其思维方法,认识到其“不能一步到位”的局限性,并学会利用其他工具进行辅助。
3. **DeepSeek为何有效:**
* Transformer是一种特殊的神经网络,几乎现在所有典型大模型都采用这种神经网络
* Transformer的整体流程包括token编码(Embedding),计算token之间的关系 (Attention), 理解每个token自己的含义(MLPs),编码还原成token并输出(Unembedding)。
* LLM通过数据学习文字接龙,数据和参数规模越大,LLM就越聪明。
* 在多种语言上做预训练后,只要教某一个语言的某一个任务,自动学会其他语言的同样任务。
* 训练完针对特定领域效果不佳时,需要对模型进行后训练对齐,包括监督式微调(SFT)和强化学习(RL)。
4. **下一步的关注点:**
* 生态爆发在即,需要关注国产AI芯片、高性能互连、训练和推理框架、模型算法、算力底座以及行业应用等环节。
* DeepSeek等模型的出现使AI飞入寻常百姓家,要抓住这一机遇,并用阳谋对抗阴谋,用全中国全世界的智慧一起创新。
相关报告
-
4.99 MB 28页 四问DeepSeek,如何看待《哪吒2》爆火?-艺恩数据-202502.pdf
-
16.78 MB 75页 DeepSeek如何赋能职场应用——从提示语技巧到多场景应用(0212)-清华大学-202502.pdf
-
4.54 MB 65页 普通人如何抓住DeepSeek红利-清华大学-202502.pdf
-
9.78 MB 35页 DeepSeek如何赋能职场应用?——从提示语技巧到多场景应用-清华大学-202502.pdf
-
49.96 MB 258页 DeepSeek企业落地应用讲义精华全版-大任智库-202502.pdf
-
8.36 MB 76页 DeepSeek R1+Kimi1.5及类强推理模型开发解读-北京大学-202502.pdf
-
16.73 MB 117页 2025年DeepSeek完全实用手册V1.0——从技术原理到使用技巧-至顶AI实验室-202502.pdf
-
5.02 MB 76页 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502.pdf
-
13.36 MB 71页 DeepSeek:智能时代的全面到来和人机协作的新常态-浙江大学-202502.pdf
-
18.56 MB 24页 DeepSeek模型优势:算力、成本角度解读-浙江大学-202502.pdf
-
42.68 MB 52页 DeepSeek:回望AI三大主义与加强通识教育-浙江大学-202502.pdf
-
18.43 MB 86页 DeepSeek内部研讨系列:DeepSeek提示词工程和落地场景-北京大学-202502.pdf
-
11.47 MB 98页 DeepSeek内部研讨系列:DeepSeek与AIGC应用-北京大学-202502.pdf
-
14.83 MB 77页 数字金融行业系列深度之一:DeepSeek如何加速金融业数字化转型?-中信建投-20250223.pdf
-
18.77 MB 100页 DeepSeek+DeepResearch:让科研像聊天一样简单(完整版)-清华大学-202502.pdf
-
4.87 MB 153页 2025年DeepSeek行业应用案例集——解锁智能变革密码-浙江大学-202502.pdf