Pirotta, M., Restelli, M., & Bascetta, L. (2015). Policy gradient in Lipschitz Markov Decision Processes. Machine learning, 100(2-3), 255-283. https://doi.org/10.1007/s10994-015-5484-1
Chicago-Zitierstil (17. Ausg.)Pirotta, Matteo, Marcello Restelli, und Luca Bascetta. "Policy Gradient in Lipschitz Markov Decision Processes." Machine Learning 100, no. 2-3 (2015): 255-283. https://doi.org/10.1007/s10994-015-5484-1.
MLA-Zitierstil (9. Ausg.)Pirotta, Matteo, et al. "Policy Gradient in Lipschitz Markov Decision Processes." Machine Learning, vol. 100, no. 2-3, 2015, pp. 255-283, https://doi.org/10.1007/s10994-015-5484-1.
Achtung: Diese Zitate sind unter Umständen nicht zu 100% korrekt.