A TD3-based multi-agent deep reinforcement learning method in mixed cooperation-competition environment
We explored the problem about function approximation error and complex mission adaptability in multi-agent deep reinforcement learning. This paper proposes a new multi-agent deep reinforcement learning algorithm framework named multi-agent time delayed deep deterministic policy gradient. Our work re...
Gespeichert in:
| Veröffentlicht in: | Neurocomputing (Amsterdam) Jg. 411; S. 206 - 215 |
|---|---|
| Hauptverfasser: | , , |
| Format: | Journal Article |
| Sprache: | Englisch |
| Veröffentlicht: |
Elsevier B.V
21.10.2020
|
| Schlagworte: | |
| ISSN: | 0925-2312, 1872-8286 |
| Online-Zugang: | Volltext |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!