Search Results - "Q-learning with linear function approximation"
-
1
Authors:
Source: IEEE Transactions on Automatic Control. :1-8
Subject Terms: FOS: Computer and information sciences, 0209 industrial biotechnology, Artificial Intelligence (cs.AI), 0203 mechanical engineering, Computer Science - Artificial Intelligence, 02 engineering and technology
Access URL: http://arxiv.org/abs/2401.15196
-
2
Authors:
Source: 2024 European Control Conference (ECC). :2500-2505
-
3
-
4
-
5
Authors:
-
6
Authors:
Source: Discrete Event Dynamic Systems. 26:477-509
Subject Terms: 0209 industrial biotechnology, 0203 mechanical engineering, Computer Science & Automation (Formerly, School of Automation), 02 engineering and technology
File Description: application/pdf
Access URL: http://eprints.iisc.ac.in/id/eprint/54360
https://www.amrita.edu/publication/multiscale-q -learning -linear -function -approximation
https://dblp.uni-trier.de/db/journals/deds/deds26.html#BhatnagarL16
https://link.springer.com/content/pdf/10.1007%2Fs10626-015-0216-z.pdf
https://dl.acm.org/doi/10.1007/s10626-015-0216-z
https://link.springer.com/article/10.1007/s10626-015-0216-z -
7
Authors: et al.
Source: Neurocomputing. 611:128654
-
8
Authors:
Source: 2007 European Control Conference (ECC). :2671-2678
Subject Terms: 0209 industrial biotechnology, 0202 electrical engineering, electronic engineering, information engineering, 02 engineering and technology
Access URL: https://ieeexplore.ieee.org/document/7068926/
-
9
Authors:
Source: Lecture Notes in Computer Science ISBN: 9783540729259
Subject Terms: 4. Education
Access URL: https://rd.springer.com/chapter/10.1007/978-3-540-72927-3_23
http://www.ausy.tu-darmstadt.de/uploads/Research/MPI2007/TechReport.pdf
http://lrm.isr.ist.utl.pt/lrm/ps/07-COLT-QLPO.pdf
http://www.ausy.tu-darmstadt.de/uploads/Research/MPI2007/MPI2007melo2.pdf
https://dblp.uni-trier.de/db/conf/colt/colt2007.html#MeloR07
https://link.springer.com/chapter/10.1007%2F978-3-540-72927-3_23 -
10
-
11
Authors:
Source: Discrete Event Dynamic Systems; Sep2016, Vol. 26 Issue 3, p477-509, 33p
-
12
Authors: et al.
Contributors: et al.
Source: UPCommons. Portal del coneixement obert de la UPC
Universitat Politècnica de Catalunya (UPC)Subject Terms: Artificial intelligence, Safe Reinforcement Learning, Interreg Europeu, Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial, Ambulance Dispatch, Deep Q-Learning, European Interreg, SIA-REMU Project, Enviament d'Ambulàncies, Double Deep Q-Learning, Q-Learning with Linear Function Approximation, Machine Learning, Aprenentatge per Reforç Amb Aproximació dels Valors Estat-Acció, Gestió de Recursos Médics, Aprenentatge per Reforç amb Aversió al Risc, Artificial Intelligence, Aprenentatge per Reforç Segur, Machine learning, Reinforcement learning, Aprenentatge automàtic, Intel·ligència Artificial, Risk-Averse Reinforcement Learning, Projecte SIA-REMU, Ambulance service, Aprenentatge Automàtic, Soft Actor-Critic, Intel·ligència artificial, Aprenentatge per Reforç, Reinforcement Learning, Actor-Critic Methods, Safe Model-Based Policy Optimization, Mètodes d'Actor-Crític, Reinforcement Learning Approximating the State-Action Values, Aprenentatge per reforç, Servei d'ambulàncies, Q-Learning amb Aproximació Lineal de Funcions, Management of Medical Resources
File Description: application/pdf
Access URL: https://hdl.handle.net/2117/405691
-
13
Authors: et al.
Source: Learning Theory (9783540729259). 2007, p308-322. 15p.
-
14
Authors:
Contributors:
File Description: application/pdf
-
15
Authors:
Source: 2007 European Control Conference (ECC); 2007, p2671-2678, 8p
-
16
Authors:
-
17
Authors: et al.
Index Terms: Àrees temàtiques de la UPC::Informàtica::Intel·ligència artificial, Artificial intelligence, Machine learning, Reinforcement learning, Ambulance service, Intel·ligència Artificial, Aprenentatge Automàtic, Aprenentatge per Reforç, Aprenentatge per Reforç Segur, Enviament d'Ambulàncies, Gestió de Recursos Médics, Interreg Europeu, Projecte SIA-REMU, Aprenentatge per Reforç Amb Aproximació dels Valors Estat-Acció, Mètodes d'Actor-Crític, Aprenentatge per Reforç amb Aversió al Risc, Q-Learning amb Aproximació Lineal de Funcions, Deep Q-Learning, Double Deep Q-Learning, Soft Actor-Critic, Safe Model-Based Policy Optimization, Artificial Intelligence, Machine Learning, Reinforcement Learning, Safe Reinforcement Learning, Ambulance Dispatch, Management of Medical Resources, European Interreg, SIA-REMU Project, Reinforcement Learning Approximating the State-Action Values, Actor-Critic Methods, Risk-Averse Reinforcement Learning, Q-Learning with Linear Function Approximation, Intel·ligència artificial, Aprenentatge automàtic, Aprenentatge per reforç, Servei d'ambulàncies, Master thesis
-
18
Authors:
Source: Foundations & Trends in Optimization; 2025, Vol. 8 Issue 1-3, p1-332, 332p
-
19
Authors:
Source: Mathematics of Operations Research; Nov2025, Vol. 50 Issue 4, p3125-3160, 36p
Subject Terms: MARKOV processes, REINFORCEMENT learning, STOCHASTIC analysis, UNIVERSITY research
-
20
Authors: et al.
Source: International Journal of Intelligent Engineering & Systems; 2025, Vol. 18 Issue 11, p29-44, 16p
Full Text Finder
Nájsť tento článok vo Web of Science