报告题目:从视频、文本到智能体策略学习
报告时间:2023年6月16日上午9:30
报告地点:新葡萄8883官网AMGB405
报告人:卢宗青
报告人国籍:中国
报告人单位:北京大学
报告人简介:北京大学新葡萄8883官网AMG助理教授、博雅青年学者,国家海外高层次青年人才,智源学者,北京智源人工智能研究院多模态交互研究中心负责人。主要研究强化学习以及开放世界通用智能体。https://z0ngqing.github.io/
报告摘要:过去几年强化学习研究取得了突破性成果,然而强化学习仍然面临诸多挑战,比如样本效率低、难解决长程稀疏奖励任务、策略缺乏泛化性等问题,使得强化学习难以广泛应用。最近大模型的成功为解决强化学习的这些问题提供了新的思路。这次报告将介绍利用视频与文本帮助智能体策略学习的一些探索以及如何在“我的世界(Minecraft)”中训练可以完成复杂多样任务的通用智能体的方法。强化学习与大模型的结合有可能实现 Daniel Kahneman 所描述的 System1/2 人类决策模型。
邀请人:罗勇