Покращення навчання з підкріпленням для складних задач руху робота

Метою статті є вирішення проблеми сходження або застрягання рішення в небажаних локальних оптимумах при використанні PPO, що може покращити результат навчання для задач слідування робота заданим точкам або параметрам руху. Об’єктом дослідження є процес навчання з підкріпленням в задачах руху робота....

Full description

Saved in:
Bibliographic Details
Published in:Adaptivni sistemi avtomatičnogo upravlinnâ (Online) Vol. 2; no. 47; pp. 41 - 53
Main Authors: Грибенко, Є., Таран, В.
Format: Journal Article
Language:English
Published: Igor Sikorsky Kyiv Polytechnic Institute 28.09.2025
Subjects:
ISSN:1560-8956, 2522-9575
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Be the first to leave a comment!
You must be logged in first