Sequential Decision Making With Limited Observation Capability: Application to Wireless Networks

This paper studies a generalized class of restless multi-armed bandits with hidden states and allow cumulative feedback, as opposed to the conventional instantaneous feedback. We call them lazy restless bandits (LRBs) as the events of decision making are sparser than the events of state transition....

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:IEEE transactions on cognitive communications and networking Ročník 5; číslo 2; s. 237 - 251
Hlavní autoři: Kaza, Kesav, Meshram, Rahul, Mehta, Varun, Merchant, Shabbir N.
Médium: Journal Article
Jazyk:angličtina
Vydáno: Piscataway IEEE 01.06.2019
The Institute of Electrical and Electronics Engineers, Inc. (IEEE)
Témata:
ISSN:2332-7731, 2332-7731
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.