A stopping time-based policy iteration algorithm for Markov decision processes with discountfactor tending to 1

J. Wal, van der

Onderzoeksoutput: Boek/rapportRapportAcademic

22 Downloads (Pure)

Vingerafdruk Duik in de onderzoeksthema's van 'A stopping time-based policy iteration algorithm for Markov decision processes with discountfactor tending to 1'. Samen vormen ze een unieke vingerafdruk.

Engineering en materiaalwetenschappen