Doorgaan naar hoofdnavigatie Doorgaan naar zoeken Ga verder naar hoofdinhoud

Geometric convergence in average reward Markov decision processes

  • W.H.M. Zijm

Onderzoeksoutput: Boek/rapportRapportAcademic

500 Downloads (Pure)

Samenvatting

Recently, Federgruen and Schweitzer [3] proved that in undiscounted Markov decision problems the value iteration method for finding maximal gain policies converges geometrically fast, whenever convergence occurs. This result was obtained without any restriction on either the periodicity or chain structure of the problem. In this paper we establish the same result once again; the proof however, seems essentially simpler and, moreover, yields an upperbound for the convergence rate.
Originele taal-2Engels
Plaats van productieEindhoven
UitgeverijTechnische Hogeschool Eindhoven
Aantal pagina's9
StatusGepubliceerd - 1980

Publicatie series

NaamMemorandum COSOR
Volume8008
ISSN van geprinte versie0926-4493

Vingerafdruk

Duik in de onderzoeksthema's van 'Geometric convergence in average reward Markov decision processes'. Samen vormen ze een unieke vingerafdruk.

Citeer dit