Optimization of reward shaping function based on genetic algorithm applied to a cross validated deep deterministic policy gradient in a powered landing guidance problem

One major capability of a Deep Reinforcement Learning (DRL) agent to control a specific vehicle in an environment without any prior knowledge is decision-making based on a well-designed reward shaping function. An important but little-studied major factor that can alter significantly the training re...

Celý popis

Uloženo v:

Podrobná bibliografie
Vydáno v:	Engineering applications of artificial intelligence Ročník 120; s. 105798
Hlavní autoři:	Nugroho, Larasmoyo, Andiarti, Rika, Akmeliawati, Rini, Kutay, Ali Türker, Larasati, Diva Kartika, Wijaya, Sastra Kusuma
Médium:	Journal Article
Jazyk:	angličtina
Vydáno:	Elsevier Ltd 01.04.2023
Témata:	DDPG Fitness GA-search Reusable launch vehicle Reward shaping function Reward shaping function DDPG Reusable launch vehicle GA-search Fitness
ISSN:	0952-1976, 1873-6769
On-line přístup:	Získat plný text
Tagy:	Přidat tag Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!

Buďte první, kdo okomentuje tento záznam!