A stopping time-based policy iteration algorithm for average reward Markov decision processes

J. Wal, van der

Onderzoeksoutput: Boek/rapportRapportAcademic

34 Downloads (Pure)

Vingerafdruk Duik in de onderzoeksthema's van 'A stopping time-based policy iteration algorithm for average reward Markov decision processes'. Samen vormen ze een unieke vingerafdruk.