Foresighted policy gradient reinforcement learning: solving large-scale dilemmas with rational altruistic punishment

P.J. t Hoen, S.M. Bohté, J.A. Poutré, La

Onderzoeksoutput: Boek/rapportRapportPopulair

Originele taal-2Engels
Plaats van productieAmsterdam
UitgeverijCentrum voor Wiskunde en Informatica
StatusGepubliceerd - 2008

Publicatie series

NaamCWI report. SEN-R : software engineering
Volume0804
ISSN van geprinte versie1386-369X

Citeer dit