Deep deterministic policy gradient algorithm based on dung beetle optimization and priority experience replay mechanism

Reinforcement learning algorithms that handle continuous action spaces have the problem of slow convergence and local optimality. Hence, we propose a deep deterministic policy gradient algorithm based on the dung beetle optimization algorithm (DBOP–DDPG) and priority experience replay mechanism. Thi...

Celý popis

Uloženo v:

Podrobná bibliografie
Vydáno v:	Scientific reports Ročník 15; číslo 1; s. 13978 - 14
Hlavní autoři:	Zhu, Hengwei, Rong, Chuiting, Liu, Haorui
Médium:	Journal Article
Jazyk:	angličtina
Vydáno:	London Nature Publishing Group UK 22.04.2025 Nature Portfolio
Témata:	639/705/117 639/705/258 Humanities and Social Sciences multidisciplinary Science Science (multidisciplinary)
ISSN:	2045-2322, 2045-2322
On-line přístup:	Získat plný text
Tagy:	Přidat tag Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!

Buďte první, kdo okomentuje tento záznam!