基于多智能体深度强化学习的无人艇集群博弈对抗研究

TJ630%U664.82; 基于未来现代化海上作战背景,提出了利用多智能体深度强化学习方案来完成无人艇群博弈对抗中的协同围捕任务.首先,根据不同的作战模式和应用场景,提出基于分布式执行的多智能体深度确定性策略梯度算法,并对其原理进行了介绍;其次,模拟具体作战场景平台,设计多智能体网络模型、奖励函数机制以及训练策略.实验结果表明,文中方法可以有效应对敌方无人艇的协同围捕决策问题,在不同作战场景下具有较高的效率,为未来复杂作战场景下无人艇智能决策研究提供理论参考价值....

Full description

Saved in:

Bibliographic Details
Published in:	水下无人系统学报 Vol. 32; no. 1; pp. 79 - 86
Main Authors:	于长东, 刘新阳, 陈聪, 刘殿勇, 梁霄
Format:	Journal Article
Language:	Chinese
Published:	大连海事大学船舶与海洋工程学院,辽宁大连, 116026 01.02.2024 哈尔滨工程大学智能海洋航行器技术全国重点实验室,黑龙江哈尔滨, 150001%哈尔滨工程大学智能海洋航行器技术全国重点实验室,黑龙江哈尔滨, 150001 大连海事大学人工智能学院,辽宁大连, 116026
Subjects:	无人艇集群智能决策深度强化学习 game confrontation 多智能体深度确定性策略梯度算法 deep reinforcement learning intelligent decision-making unmanned surface vehicle swarm multi-agent deep deterministic policy gradient algorithm 博弈对抗
ISSN:	2096-3920
Online Access:	Get full text
Tags:	Add Tag No Tags, Be the first to tag this record!

Description
Summary:	TJ630%U664.82; 基于未来现代化海上作战背景,提出了利用多智能体深度强化学习方案来完成无人艇群博弈对抗中的协同围捕任务.首先,根据不同的作战模式和应用场景,提出基于分布式执行的多智能体深度确定性策略梯度算法,并对其原理进行了介绍;其次,模拟具体作战场景平台,设计多智能体网络模型、奖励函数机制以及训练策略.实验结果表明,文中方法可以有效应对敌方无人艇的协同围捕决策问题,在不同作战场景下具有较高的效率,为未来复杂作战场景下无人艇智能决策研究提供理论参考价值.
ISSN:	2096-3920
DOI:	10.11993/j.issn.2096-3920.2023-0159