Natural actor–critic algorithms
We present four new reinforcement learning algorithms based on actor–critic, natural-gradient and function-approximation ideas, and we provide their convergence proofs. Actor–critic reinforcement learning methods are online approximations to policy iteration in which the value-function parameters ar...
Gespeichert in:
| Veröffentlicht in: | Automatica (Oxford) Jg. 45; H. 11; S. 2471 - 2482 |
|---|---|
| Hauptverfasser: | , , , |
| Format: | Journal Article |
| Sprache: | Englisch |
| Veröffentlicht: |
Kidlington
Elsevier Ltd
01.11.2009
Elsevier |
| Schlagworte: | |
| ISSN: | 0005-1098, 1873-2836 |
| Online-Zugang: | Volltext |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!