Публикации по теме 'q-learning-implementation'


Q-Learning: первый и главный алгоритм обучения с подкреплением
Введение При изучении обучения с подкреплением самый простой и простой алгоритм, который нужно знать, - это Q-Learning. Есть много терминов, связанных с RL, которые каждый должен знать для начала и понимать их. Q-Learning - это не только простой алгоритм, но и очень интересный, который можно применять для получения почти всех реальных решений. Прежде всего, мы должны знать, что «Q» в Q-Learning означает «качество». Он определяет действия, предпринимаемые нашим агентом, и помогает..