清华大学-大模型工具学习（中英文）-2024-96页.pdf下载

这份文档是关于工具学习的介绍，主要面向大型语言模型（LLM）的研究与应用。文档首先介绍了工具与智能的关系，指出人类历史上一直使用工具，并探讨了人工智能在工具使用方面的潜力。核心内容包括： 1. **背景与动机：** 随着基础模型的发展，工具学习变得越来越重要。LLM 能够通过学习使用工具来解决更复杂的任务。 2. **工具学习的分类：** 文档介绍了两种主要的工具学习方法： * **工具增强学习：** 增强基础模型，利用工具的执行结果来扩充模型，提高输出质量。 * **工具导向学习：** 让模型管理工具，代替人类进行顺序决策，利用模型的世界知识和推理能力进行复杂推理和规划。 3. **框架：** 描述了一个工具学习的框架，包含以下组件： * **控制器（Controller）：** 提供可行的计划来满足用户请求。 * **感知器（Perceiver）：** 汇总反馈给控制器。 * **工具集（Tool Set）：** 包含不同功能的工具集合。 * **环境（Environment）：** 提供工具运行的平台。 4. **意图理解：** 阐述了理解指令的重要性，以及从指令空间到模型认知空间的映射。还讨论了指令调整、监督微调和泛化能力等概念。挑战包括理解模糊指令和处理理论上无限的指令空间。 5. **工具理解：** 介绍了通过提示激发工具理解的方法，包括： * **零样本提示（Zero-shot prompting）：** 描述 API 功能、输入/输出格式、参数等。 * **少样本提示（Few-shot prompting）：** 提供具体的工具使用演示。 6. **规划与推理：** 深入探讨了规划与推理。 * **内省推理：** 在不与环境交互的情况下生成静态计划。 * **外向推理：** 生成考虑环境变化和反馈的动态计划。强调了多步骤多工具方案、不同工具的相互作用、从顺序执行到并行执行，以及从单代理问题解决到多代理协作的必要性。 7. **训练策略：** 介绍了两种主要的训练方法： * **从演示中学习：** 通常涉及人工标注。 * **从反馈中学习：** 通常涉及强化学习。 8. **WebGPT 和 WebCPM：** 简要介绍了 WebGPT 以及 WebCPM（一个开源交互式网络搜索界面），后者涉及交互式网络搜索的公共QA数据集，并用于中文长文本问题回答。 9. **Toolformer：** 介绍了自监督工具学习，包括预定义的工具 API、鼓励模型调用和执行工具 API，以及设计自监督损失。 10. **工具创建：** 强调了从工具用户到工具创建者的转变。 * 模型制作工具强调模块化和新的输入/输出格式。 * 介绍了创建工具的四个程序：创建、决策、执行和整改。 * 展示了实验结果，表明对 PoT（Program of Thoughts）和 pure CoT（Chain of Thought）的重大改进。 11. **应用：** 提到了 ChatGPT 插件和开源解决方案。 * **ChatGPT 插件：** 概述了 OpenAI 官方工具库，以及通过 API 调用应用程序的能力。 * **开源解决方案：** 介绍了 BMTools 和 ToolBench 等开源平台，它们提供了可扩展 LLM 使用工具的框架，并促进社区共享工具。 12. **总结：** 强调了工具学习的重要性，指出传统语言任务已得到良好解决，而面临着更具挑战性的任务。基础模型在复杂场景中的潜力依赖于LLM的有效性，理论和实际问题仍然存在，需要探索在复杂场景中利用工具学习。

清华大学-大模型工具学习（中英文）-2024-96页.pdf

相关报告

8.91 MB 96页三十而立，向光而行：中国地产行业趋势与展望-仲量联行&清华大学-2024-96页.pdf

1.54 MB 33页 2024年中国大模型行业应用优秀案例白皮书-沙利文-2024-33页.pdf

4.27 MB 195页 2024全球碳中和年度进展报告附录-清华大学-2024.10-195页.pdf

6.31 MB 64页 2024短视频时代的大众文旅生活白皮书-清华大学&国家形象传播研究中心-2024-64页.pdf

5.14 MB 59页中文大模型基准测评2024年上半年报告——2024年度中文大模型阶段性进展评估-SuperCLUE团队-2024.7.9-59页.pdf

3.73 MB 52页 2024大模型十大趋势：走进“机器外脑”时代-腾讯&上海交通大学-2024-52页.pdf

16.31 MB 86页中国剧集创新发展与审美多元化研究报告-清华大学-2024.6-86页.pdf

8.81 MB 24页 2024年中国大模型评测报告-Al变革行业创新发展-沙利文&头豹-24页.pdf

40.6 MB 96页 2024生成式人工智能治理与实践白皮书-阿里巴巴&达摩院-96页.pdf

1.61 MB 43页 2023年文化和旅游产业投融资分析报告-清华大学五道口金融学院-2024-41页.pdf

3.86 MB 73页创新十年，未来十年—致敬中国生物医药创新奋斗者们报告-科睿唯安-2024.11-72页.pdf

4.54 MB 68页 2024全球人形机器人企业画像与能力评估-觅途咨询-2024-67页

4.74 MB 62页 2024年金融AIGC音视频反欺诈白皮书-交通银行&顶象&瑞莱-2024.12-60页.pdf

10.11 MB 43页 2024-2025中国食醋行业发展现状及未来趋势报告-博晓通科技-2024.12-41页

1.63 MB 49页 2024年中国国际收支报告-国家外汇管理局-2025-49页.pdf

6.34 MB 68页 2024年郑州城市与地产年鉴-泰辰顾问-2025-68页.pdf

2.53 MB 31页 2024年微信品牌保护报告-微信-32页.pdf

2.66 MB 123页 2024年度药品审评报告-国家药品监督局-2025.3-123页.pdf

5.31 MB 78页民用飞机中国市场预测年报2024-2043（中英）-中国航空工业集团有限公司-2024-76页

1.26 MB 49页 TikTok败诉案判决全文（中英对照）-2024.12-48页