Residual Sarsa algorithm with function approximation
In this work, we proposed an efficient algorithm named the residual Sarsa algorithm with function approximation (FARS) to improve the performance of the traditional Sarsa algorithm, and we use the gradient-descent method to update the function parameter vector. In the learning process, the Bellman r...
Gespeichert in:
| Veröffentlicht in: | Cluster computing Jg. 22; H. Suppl 1; S. 795 - 807 |
|---|---|
| Hauptverfasser: | , , , , , |
| Format: | Journal Article |
| Sprache: | Englisch |
| Veröffentlicht: |
New York
Springer US
01.01.2019
Springer Nature B.V |
| Schlagworte: | |
| ISSN: | 1386-7857, 1573-7543 |
| Online-Zugang: | Volltext |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!