Anhand der value-function wird untersucht, wie gut
eine Handlung in der gegebenen Situation ist. Die state-value function
beschreibt, wie gut (oder schlecht) ein Zustand nach einer Handlung zu bewerten
ist. Die action-value function beschreibt, wie gut (oder schlecht) eine
Handlung in besagtem Zustand ist. Beide Funktionen bestimmen die Qualität der
Handlung und sind Bestandteil des Q-Learnings.