Публикации по теме 'probabilistic-models'
Обучение с подкреплением как вероятностное моделирование: формулировка вариационного вывода (часть I)
Обучение с подкреплением связано с попыткой агента достичь оптимального поведения в неизвестных средах, которые обычно проявляют стохастичность. Несмотря на минимальный контроль, алгоритмы обучения с подкреплением продемонстрировали многочисленные успехи - от решения игр ATARI с использованием Deep Q-Networks до триумфальной победы над чемпионами мира в игре GO, а недавно и в Start Craft.
Возможно, наиболее интуитивно понятная формулировка обучения с подкреплением исходит из книги Эндрю и..
Первая алгоритмическая выборка ребенка из раздачи: доступные методы и способы их использования
Практические руководства
Первая алгоритмическая выборка ребенка из раздачи: доступные методы и способы их использования
Медленное и доступное введение в выборку и аппроксимацию сложных распределений
TL;DR
Эта рецензия включает описания из недавней статьи об алгоритмической выборке , чтобы в более простых терминах описать мотивацию и подход к выборке с использованием простых методов или методов Монте-Карло с цепью Маркова. Он построен на алгоритме Метрополиса Гастингса как..
Глубокое вероятностное моделирование (I). Обзор традиционных методов вывода
Почему традиционное вероятностное моделирование сосредоточено на выявлении линейных отношений между случайными величинами.
В основополагающих работах Джудеи Перл [@ Pearl88] и Стивена Лауритцена [@ lauritzen1992propagation] о вероятностных графических моделях (PGM) вероятностное моделирование рассматривается как незаменимый инструмент для решения многих проблем, связанных с любой формой неопределенности в самых разных областях, таких как искусственный интеллект [ @..