清华大学-大模型工具学习(中英文)-2024-96页.pdf

摘要 : 本文讨论了人工智能在工具使用方面的能力,特别是基础模型在工具学习方面的进展。文章首先指出工具是人类能力的延伸,历史上人类通过发明和使用工具来提高生产力和解决问题的能力。随后,文章提出问题:人工智能是否也能像人类一样使用工具?基础模型通过较强的语义理解、广泛的世界知识和强大的推理计划能力,能够遵循人类指令和操纵工具来解决问题。 文章进一步将工具学习分为三个类别:工具增强学习、面向工具的学习以及THUNLP框架。工具增强学习通过执行结果扩充基础模型,将工具视为补充资源以产生高质量产出。面向工具的学习则利用模型管理工具并代替人类做出顺序决策。THUNLP框架包括环境、感知者、工具集和控制器,通过理解用户指令和学习指令空间到模型认知空间的映射,实现任务的执行。 在意图理解方面,文章强调了扩大模型大小和指令调整数据集多样性的重要性,以及理解模糊指令和理论上无限指令空间的挑战。通过提示激发工具理解,模型可以学习如何利用工具,包括零拍提示和少量提示,以及通过模仿人类行为学习工具的使用。 规划与推理部分,文章讨论了内省推理和外向推理两种方法。内省推理在不与环境交互的情况下生成静态计划,而外向推理则生成考虑环境变化和反馈的动态计划。文章还提到了多步骤多工具方案,强调了了解不同工具之间相互作用的重要性。 最后,文章引用了相关研究,如Ahn等人的“Do as I can, not as I say: Grounding language in robot affiliations”和黄文龙等人的“内心独白:通过语言模型进行规划的具身推理”,展示了在工具使用和规划推理方面的最新进展。
在线阅读 下载报告 | 7 MB | 97页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告
与最强人工智能Ai对话