当前位置:首页 > 科研工作 > 重点项目

重点项目

面向多任务的多智能体强化学习理论与应用

  • 发表日期:2022-03-24 【 【打印】【关闭】
  •  
    【关键词】  新型智能控制;新型智能理论;新型智能模型;新型智能应用;深度强化学习
    深度强化学习方法取得了人工智能领域一个个里程碑式的成果,如视频游戏、围棋、国际象棋等完全信息博弈,麻将和星际争霸等更复杂场景下的不完全信息博弈,带动了广泛基础学科的发展和纵深应用领域的技术进步。然而,现实世界的更多问题是面向多任务的多智能体的机器博弈,是人工智能领域的下一项重大挑战。因此,本项目研究内容包括:1) 研究多智能体深度强化学习的收敛性、稳定性和鲁棒性理论,奠定理论基础;2) 研究面向多任务的智能体同构/异构、数量可变和拓扑结构可扩展的学习架构;3) 高维状态动作空间随智能体数量指数增长,研究高效动作空间分解的策略优化方法;4) 不完全信息博弈是显著特点,研究队友间的高效通信方法和环境/对手信息的有效估计表达;5) 研究从仿真场景下小样本的博弈均衡问题,到实体迁移的安全性问题;6) 最后从仿真(游戏博弈)到实体(机器人博弈)验证所提出的面向多任务的多智能体深度强化学习理论和应用。