Покращення навчання з підкріпленням для складних задач руху робота
Метою статті є вирішення проблеми сходження або застрягання рішення в небажаних локальних оптимумах при використанні PPO, що може покращити результат навчання для задач слідування робота заданим точкам або параметрам руху. Об’єктом дослідження є процес навчання з підкріпленням в задачах руху робота....
Gespeichert in:
| Veröffentlicht in: | Adaptivni sistemi avtomatičnogo upravlinnâ (Online) Jg. 2; H. 47; S. 41 - 53 |
|---|---|
| Hauptverfasser: | , |
| Format: | Journal Article |
| Sprache: | Englisch |
| Veröffentlicht: |
Igor Sikorsky Kyiv Polytechnic Institute
28.09.2025
|
| Schlagworte: | |
| ISSN: | 1560-8956, 2522-9575 |
| Online-Zugang: | Volltext |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!