信管·讲座|合作多智能体强化学习：理论、算法及应用

2024-10-24

时间

TIME

2023年8月17日（周四）

上午9:50 – 10:50

地点

VENUE

讲座地点：信息管理与工程学院308会议室

腾讯会议：398363749；参会密码：135790

主讲人

SPEAKER

李文浩

香港中文大学 (深圳) 博士后研究员

李文浩博士毕业于华东师范大学，由周爱民教授和查宏远教授联合指导。李博士目前在机器学习顶级期刊JMLR、TPAMI、TCYB以及会议ICLR、ICML、AAMAS、CVPR、IJCAI、KDD、ICRA上发表论文近20篇，主持博士后自然科学基金面上项目1项；博士论文《合作促进多智能体强化学习》荣获上海市计算机学会评定的“2022年度优秀博十论文奖提名奖”。

主题

TITLE

合作多智能体强化学习：理论、算法及应用

摘要

ABSTRACT

多智能体强化学习近年来在求解群体序列决策任务中表现出了优异的性能。在其中，智能体外部环境的变化，以及获得的奖励，都不再仅依赖于智能体自身采取的决策，还需要考虑其他智能体决策的影响。这使得算法不可避免地需要赋予智能体建模其余智能体的能力。本报告将介绍在赋予智能体不同层次建模能力上理论及算法层面的一系列探索，包括从低层次的理解、通信，到高层次的承诺机制，及算法落地应用方面的若干尝试，例如路径规划、智慧农业、精准医疗。这其中同样涉及到一些关键的理论痛点，包括高效的分布式优化技术、高保真的神经网络表示等。最后，本报告将会讨论在预训练大模型时代，多智能体强化学习范式的未来发展趋势。

欢迎关注！