清华大学-大模型工具学习(中英文)-2024-96页.pdf
摘要 : 本文讨论了人工智能在工具使用方面的能力,特别是基础模型在工具学习方面的进展。文章首先指出工具是人类能力的延伸,历史上人类通过发明和使用工具来提高生产力和解决问题的能力。随后,文章提出问题:人工智能是否也能像人类一样使用工具?基础模型通过较强的语义理解、广泛的世界知识和强大的推理计划能力,能够遵循人类指令和操纵工具来解决问题。
文章进一步将工具学习分为三个类别:工具增强学习、面向工具的学习以及THUNLP框架。工具增强学习通过执行结果扩充基础模型,将工具视为补充资源以产生高质量产出。面向工具的学习则利用模型管理工具并代替人类做出顺序决策。THUNLP框架包括环境、感知者、工具集和控制器,通过理解用户指令和学习指令空间到模型认知空间的映射,实现任务的执行。
在意图理解方面,文章强调了扩大模型大小和指令调整数据集多样性的重要性,以及理解模糊指令和理论上无限指令空间的挑战。通过提示激发工具理解,模型可以学习如何利用工具,包括零拍提示和少量提示,以及通过模仿人类行为学习工具的使用。
规划与推理部分,文章讨论了内省推理和外向推理两种方法。内省推理在不与环境交互的情况下生成静态计划,而外向推理则生成考虑环境变化和反馈的动态计划。文章还提到了多步骤多工具方案,强调了了解不同工具之间相互作用的重要性。
最后,文章引用了相关研究,如Ahn等人的“Do as I can, not as I say: Grounding language in robot affiliations”和黄文龙等人的“内心独白:通过语言模型进行规划的具身推理”,展示了在工具使用和规划推理方面的最新进展。
相关报告
-
6.31 MB 64页 2024短视频时代的大众文旅生活白皮书-清华大学&国家形象传播研究中心-2024-64页.pdf
-
3.73 MB 52页 2024大模型十大趋势:走进“机器外脑”时代-腾讯&上海交通大学-2024-52页.pdf
-
16.31 MB 86页 中国剧集创新发展与审美多元化研究报告-清华大学-2024.6-86页.pdf
-
8.81 MB 24页 2024年中国大模型评测报告-Al变革行业创新发展-沙利文&头豹-24页.pdf
-
40.6 MB 96页 2024生成式人工智能治理与实践白皮书-阿里巴巴&达摩院-96页.pdf
-
1.61 MB 43页 2023年文化和旅游产业投融资分析报告-清华大学五道口金融学院-2024-41页.pdf
-
15.18 MB 29页 AI生产力工具暑期发展报告-月狐报告-202409.pdf
-
2.33 MB 46页 中国游戏产业AIGC发展前景报告-伽马数据-2024-46页.pdf