Покращення навчання з підкріпленням для складних задач руху робота

Метою статті є вирішення проблеми сходження або застрягання рішення в небажаних локальних оптимумах при використанні PPO, що може покращити результат навчання для задач слідування робота заданим точкам або параметрам руху. Об’єктом дослідження є процес навчання з підкріпленням в задачах руху робота....

Full description

Saved in:

Bibliographic Details
Published in:	Adaptivni sistemi avtomatičnogo upravlinnâ (Online) Vol. 2; no. 47; pp. 41 - 53
Main Authors:	Грибенко, Є., Таран, В.
Format:	Journal Article
Language:	English
Published:	Igor Sikorsky Kyiv Polytechnic Institute 28.09.2025
Subjects:	Proximal Policy Optimization локальні оптимуми машинне навчання навчання з підкріпленням рух робота
ISSN:	1560-8956, 2522-9575
Online Access:	Get full text
Tags:	Add Tag No Tags, Be the first to tag this record!

Be the first to leave a comment!