2025 DeepSeek自学手册:从理论到实践-ai呀蔡蔡-202502.pdf

DeepSeek自学手册核心内容总结
本手册旨在帮助读者全面了解DeepSeek模型,从理论到实践,涵盖了DeepSeek V3和R1的各个方面。
1. DeepSeek V3 & R1 概述:
- DeepSeek V3: 强大的MoE(混合专家)语言模型,在数学、代码等任务上表现出色,训练成本较低。其架构包括:
- **Multi-Head Latent Attention (MLA)**: 提升长文本处理效率。
- DeepSeekMoE: 提升模型性能和效率。
- **多Token预测(MTP)**:加速生成。
- DeepSeek R1: 擅长推理任务,性能比肩OpenAI o1,语言能力强。
2. DeepSeek V3 训练:
- 训练步骤:
- 无标注数据集,预训练大模型。
- 基础大模型,然后通用精调。
- 数据使用:
- 训练数据比例调整,扩大多语言覆盖。
- 推理数据:用于复杂推理任务。
- 非推理数据:用于创意写作、问答等。
- 基于规则的奖励模型:适用于明确规则的任务。
- 基于模型的奖励模型:适用于开放式任务。
- 性能: 优于开源模型,接近GPT-4o,代码竞赛和数学推理表现突出。
3. DeepSeek R1 训练:
- 训练步骤:
- DeepSeek V3 Base,监督学习。
- DeepSeek R1 Zero,强化学习(RL)。
- R1 Zero 的问题:可读性差,语言混合。
- 解决方式:
- 冷启动数据:用人工推理示例指导。
- 多阶段训练:结合写作、翻译数据,提升实用性。
- 模型蒸馏: 将R1的推理能力“压缩”到更小模型中,降低成本,提高效率。
- 局限性: 通用能力、语言混合、提示词工程、软件工程任务的挑战。
4. 提示词技巧:
- R1 仍然有效的技巧: 清晰具体、提供背景/规则、占位符标记、分解任务、提示词框架。
- R1 需要注意的技巧: 使用示例(视情况而定)、设定角色(视情况而定)、乔哈里视窗检视(仍然有效,但要理解适用场景)
- R1 无效的技巧: 逐步思考/COT。
5. DeepSeek 应用场景:
- 文本生成: 文风转换、仿写、内容批量生成、行业调研分析、论文改写等。
- 代码生成: 代码改写、注释、生成。
- 结构化输出: JSON转化。
- 角色扮演: 自定义人设、情景续写。
- 绘图: 绘制思维导图、流程图、SVG矢量图、Photoshop 图片批量处理。
- API应用: 接入Word、WPS等文档软件,接入Obsidian、FastGPT等AI知识库,接入硬件。
- 自我探索与发现、乙游剧本等场景。
6. DeepSeek 的替代方案:
- 在线服务: 秘塔AI搜索、纳米AI搜索、硅基流动,国内大厂云服务。
- 本地部署: 国内手机厂商、AI编程工具、海外产品。
- 设备配置要求: 提供 DeepSeek R1 本地部署的设备配置要求。
相关报告
-
16.73 MB 117页 2025年DeepSeek完全实用手册V1.0——从技术原理到使用技巧-至顶AI实验室-202502.pdf
-
16.78 MB 75页 DeepSeek如何赋能职场应用——从提示语技巧到多场景应用(0212)-清华大学-202502.pdf
-
9.78 MB 35页 DeepSeek如何赋能职场应用?——从提示语技巧到多场景应用-清华大学-202502.pdf
-
5.92 MB 27页 B2B市场人DeepSeekAI提示词手册-MarketUP-202502.pdf
-
5.36 MB 104页 DeepSeek从入门到精通-清华大学-202502.pdf
-
15.77 MB 96页 从技术突破到场景落地:大模型发展图谱与DeepSeek创新应用-中山大学-202503.pdf
-
13.08 MB 61页 从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例-浙江大学-202503.pdf
-
4.24 MB 10页 走向数字社会:从Deepseek到群体智慧-浙江大学-202503.pdf
-
13.36 MB 71页 DeepSeek:智能时代的全面到来和人机协作的新常态-浙江大学-202502.pdf
-
42.68 MB 52页 DeepSeek:回望AI三大主义与加强通识教育-浙江大学-202502.pdf
-
11.47 MB 98页 DeepSeek内部研讨系列:DeepSeek与AIGC应用-北京大学-202502.pdf
-
3.57 MB 38页 DeepSeek与AI幻觉-清华大学-202502.pdf
-
16.25 MB 112页 DeepSeek行业应用实践报告-智灵动力-202502.pdf
-
1.66 MB 25页 DeepSeek 15天指导手册——从入门到精通.pdf
-
1.42 MB 20页 银行行业:央行数字货币的前世与今生:从理论到实践-新时代证券-20200429.pdf