Обязательно ознакомьтесь с остальной частью серии ИИ, которую может понять каждый, которую я написал и планирую продолжить писать.

Упрощенное объяснение

Уравнение Беллмана — это способ для машин определить, какое действие следует предпринять в данной ситуации. Он делает это, рассматривая немедленные награды за каждое действие и ожидаемые будущие награды за каждое действие. Машина использует эту информацию, чтобы решить, какое действие будет для нее наилучшим в долгосрочной перспективе. Это помогает машине учиться и совершенствоваться…