Eine Action-Value-Funktion ist
eine Funktion in der Verstärkungslernmethode der künstlichen Intelligenz, die
angibt, wie viel zukünftiger Nutzen zu erwarten ist, wenn eine bestimmte Aktion
in einem bestimmten Zustand ausgeführt wird. Mit anderen Worten, sie ist eine
Funktion, die eine Aktion in einem bestimmten Zustand bewertet, indem sie die
erwartete zukünftige Belohnung berücksichtigt. Ein Beispiel hierfür ist die
Q-Funktion in der Q-Lernmethode.