Покращення навчання з підкріпленням для складних задач руху робота

Метою статті є вирішення проблеми сходження або застрягання рішення в небажаних локальних оптимумах при використанні PPO, що може покращити результат навчання для задач слідування робота заданим точкам або параметрам руху. Об’єктом дослідження є процес навчання з підкріпленням в задачах руху робота....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Adaptivni sistemi avtomatičnogo upravlinnâ (Online) Jg. 2; H. 47; S. 41 - 53
Hauptverfasser: Грибенко, Є., Таран, В.
Format: Journal Article
Sprache:Englisch
Veröffentlicht: Igor Sikorsky Kyiv Polytechnic Institute 28.09.2025
Schlagworte:
ISSN:1560-8956, 2522-9575
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!