A stopping time-based policy iteration algorithm for average reward Markov decision processes

J. Wal, van der

Onderzoeksoutput: Boek/rapportRapportAcademic

45 Downloads (Pure)

Vingerafdruk

Duik in de onderzoeksthema's van 'A stopping time-based policy iteration algorithm for average reward Markov decision processes'. Samen vormen ze een unieke vingerafdruk.

Mathematics