Preferential Proximal Policy Optimization
The Proximal Policy Optimization (PPO) is a policy gradient approach providing state-of-the-art performance in many domains through the "surrogate" objective function using stochastic gradient ascent. While PPO is an appealing approach in reinforcement learning, it does not consider the im...
Gespeichert in:
| Veröffentlicht in: | Proceedings (IEEE International Conference on Emerging Technologies and Factory Automation) S. 293 - 300 |
|---|---|
| Hauptverfasser: | , , |
| Format: | Tagungsbericht |
| Sprache: | Englisch |
| Veröffentlicht: |
IEEE
15.12.2023
|
| Schlagworte: | |
| ISSN: | 1946-0759 |
| Online-Zugang: | Volltext |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!