Die Bellmann-Gleichung ist eine
Gleichung, die in der Verstärkungslernmethode der künstlichen Intelligenz
verwendet wird, um den erwarteten Nutzen einer Aktion in einem bestimmten
Zustand zu berechnen. Sie berücksichtigt die zukünftigen Belohnungen, die durch
die Aktionen in dem Zustand erzielt werden können. Die Bellmann-Gleichung ist
ein wichtiger Bestandteil der Q-Lernmethode und anderer
Verstärkungslernmethoden.