东南大学虞文武团队在《IEEE Transactions on Automatic Control》上发表最新研究成果
文章导读
东南大学数学学院虞文武教授团队在《IEEE Transactions on Automatic Control》发表三篇研究成果,分别涉及多智能体系统安全控制、分布式强化学习和一致性优化。博士生闵笑提出低复杂度控制障碍函数方法,有效解决系统扩展性与计算复杂问题。博士生戴鹏程开发具备全局收敛性的分布式策略梯度算法,提升强化学习稳定性。副研究员莫远秋与虞文武合作改进有偏最小一致性协议,实现预设时间收敛与全局指数稳定性。三篇论文均由东南大学数学学院主导完成,研究获国家自然科学基金等项目支持。
— 内容由好学术AI分析文章内容生成,仅供参考。
(通讯员 许文盈)近日,东南大学数学学院虞文武教授团队在运筹控制领域国际顶级期刊《IEEE Transactions on Automatic Control》上以长文形式发表三篇研究成果,涵盖多智能体系统安全控制、分布式强化学习以及一致性优化等研究方向,展示了在智能系统控制理论方面的持续创新能力。
东南大学博士生闵笑在Simone Baldi与虞文武教授指导下,发表题为《Safe control of multi-agent systems via low-complexity control barrier functions》的研究成果,提出基于漏斗函数构建的低复杂度控制障碍函数方法,有效解决了传统控制障碍方法在多智能体系统中存在的可扩展性差与计算复杂等问题。该方法无需求解二次规划,保障了系统的安全性与稳定性解耦分析,提升了控制设计的实用性。
在分布式强化学习方向,戴鹏程博士在虞文武教授指导下,发表题为《Distributed neural policy gradient algorithm for global convergence of networked multi-agent reinforcement learning》的研究成果。论文围绕神经网络结构下的多智能体强化学习收敛性问题,提出了具备全局收敛性的分布式策略梯度算法,为算法稳定性提供了理论保障,推动了该领域的进一步发展。
此外,莫远秋副研究员与虞文武教授合作完成的论文《The distributed biased min-consensus protocol revisited: pre-specified finite time control strategies and small-gain based analysis》对有偏最小一致性协议进行了改进研究。通过引入时变反馈增益,实现了算法在预设时间内收敛,并基于小增益定理给出了算法全局指数稳定性的条件,提升了算法的灵活性与工程适应性。
以上三项研究成果均由东南大学数学学院作为第一单位完成,研究得到了国家自然科学基金、“科技创新2030—新一代人工智能”重大项目、江苏省应用数学科学研究中心等项目的资助。
文章链接:
https://ieeexplore.ieee.org/document/10982103/
https://ieeexplore.ieee.org/document/11003569
https://ieeexplore.ieee.org/document/11045514
供稿:数学学院
(责任编辑:刘明源 审核:宋业春)
© 版权声明
本文由分享者转载或发布,内容仅供学习和交流,版权归原文作者所有。如有侵权,请留言联系更正或删除。
相关文章
暂无评论...