(von Richard S. Sutton, Andrew G. Barto aus Ihrem Werk "Reinforcement Learning - An Introduction" 3.7 Value Functions)

We also omit
explicit arrowheads
because time always flows downward
in a backup diagram.




Gästebuch

Hat es gefallen, oder auch nicht? Ein Eintrag im Gästebuch sagt es auch uns. Genau hier klicken!