Risk-sensitive reinforcement learning

We derive a family of risk-sensitive reinforcement learning methods for agents, who face sequential decision-making tasks in uncertain environments. By applying a utility function to the temporal difference (TD) error, nonlinear transformations are effectively applied not only to the received reward...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Neural computation Jg. 26; H. 7; S. 1298
Hauptverfasser: Shen, Yun, Tobia, Michael J, Sommer, Tobias, Obermayer, Klaus
Format: Journal Article
Sprache:Englisch
Veröffentlicht: United States 01.07.2014
Schlagworte:
ISSN:1530-888X, 1530-888X
Online-Zugang:Weitere Angaben
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!