基于多智能体深度强化学习的无人艇集群博弈对抗研究

TJ630%U664.82; 基于未来现代化海上作战背景,提出了利用多智能体深度强化学习方案来完成无人艇群博弈对抗中的协同围捕任务.首先,根据不同的作战模式和应用场景,提出基于分布式执行的多智能体深度确定性策略梯度算法,并对其原理进行了介绍;其次,模拟具体作战场景平台,设计多智能体网络模型、奖励函数机制以及训练策略.实验结果表明,文中方法可以有效应对敌方无人艇的协同围捕决策问题,在不同作战场景下具有较高的效率,为未来复杂作战场景下无人艇智能决策研究提供理论参考价值....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:水下无人系统学报 Jg. 32; H. 1; S. 79 - 86
Hauptverfasser: 于长东, 刘新阳, 陈聪, 刘殿勇, 梁霄
Format: Journal Article
Sprache:Chinesisch
Veröffentlicht: 大连海事大学船舶与海洋工程学院,辽宁大连, 116026 01.02.2024
哈尔滨工程大学智能海洋航行器技术全国重点实验室,黑龙江哈尔滨, 150001%哈尔滨工程大学智能海洋航行器技术全国重点实验室,黑龙江哈尔滨, 150001
大连海事大学人工智能学院,辽宁大连, 116026
Schlagworte:
ISSN:2096-3920
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TJ630%U664.82; 基于未来现代化海上作战背景,提出了利用多智能体深度强化学习方案来完成无人艇群博弈对抗中的协同围捕任务.首先,根据不同的作战模式和应用场景,提出基于分布式执行的多智能体深度确定性策略梯度算法,并对其原理进行了介绍;其次,模拟具体作战场景平台,设计多智能体网络模型、奖励函数机制以及训练策略.实验结果表明,文中方法可以有效应对敌方无人艇的协同围捕决策问题,在不同作战场景下具有较高的效率,为未来复杂作战场景下无人艇智能决策研究提供理论参考价值.
ISSN:2096-3920
DOI:10.11993/j.issn.2096-3920.2023-0159