Публикации по теме 'monte-carlo'


Моделирование отказа
Миллион отказов насосов, почему не еще один? Как смоделировать отказы в производственном помещении. Одна из самых распространенных вещей, которые меня спрашивают на производстве, - это когда это оборудование выйдет из строя. В области химического машиностроения оборудование часто бывает насосом. Многие инженеры-технологи и инженеры по надежности оценивают это на основании отраслевых диаграмм и многолетнего опыта работы с насосами. Но очень немногие могут сказать мне, каков..

Вероятностное мышление — анализ Монте-Карло
Точное определение риска является ключевым требованием для обеспечения более эффективного принятия решений. Часто о рисках сообщается неоднозначно — часто с не более подробным описанием, чем высокий , средний или низкий . Эти термины могут интерпретироваться заинтересованными сторонами по-разному и не оставляют никакого смысла в отношении распространения риска, поскольку неизбежные колебания результатов допущений в совокупности приводят к очень разным результатам проекта. Для..

Обучение с подкреплением: концепции Q-обучения
Сегодня мы сосредоточимся на разработке концепции Q-learning для решения MDP. О псевдокоде и реализации Q-learning на Python мы поговорим в нашей следующей статье. В предыдущих историях мы реализовали как обучаемый ADP на основе моделей , так и обучающийся MC без моделей . Теперь пришло время объединить преимущества обоих и перейти к Q-обучению. Оглавление: Концепции обучения в обучении с подкреплением Выборочное среднее против постоянного размера шага От игры к игре шаг за..

Учимся на примерах: Монте-Карло
Представленный здесь код помогает понять обсуждаемые идеи. Поэтому, возможно, я удалил некоторые детали реализации. Полный код можно найти в моем репозитории GitHub . Учимся на примерах. Методы DP, обсуждавшиеся ранее , используют модель распределения для вычисления функции оптимального значения и оптимальной политики. В этом посте мы покончим с такими моделями. Во многих приложениях легче получить образцы взаимодействий агента и среды, чем точную модель, отражающую динамику..