Публикации по теме 'probabilistic-models'


Обучение с подкреплением как вероятностное моделирование: формулировка вариационного вывода (часть I)
Обучение с подкреплением связано с попыткой агента достичь оптимального поведения в неизвестных средах, которые обычно проявляют стохастичность. Несмотря на минимальный контроль, алгоритмы обучения с подкреплением продемонстрировали многочисленные успехи - от решения игр ATARI с использованием Deep Q-Networks до триумфальной победы над чемпионами мира в игре GO, а недавно и в Start Craft. Возможно, наиболее интуитивно понятная формулировка обучения с подкреплением исходит из книги Эндрю и..

Первая алгоритмическая выборка ребенка из раздачи: доступные методы и способы их использования
Практические руководства Первая алгоритмическая выборка ребенка из раздачи: доступные методы и способы их использования Медленное и доступное введение в выборку и аппроксимацию сложных распределений TL;DR Эта рецензия включает описания из недавней статьи об алгоритмической выборке , чтобы в более простых терминах описать мотивацию и подход к выборке с использованием простых методов или методов Монте-Карло с цепью Маркова. Он построен на алгоритме Метрополиса Гастингса как..

Глубокое вероятностное моделирование (I). Обзор традиционных методов вывода
Почему традиционное вероятностное моделирование сосредоточено на выявлении линейных отношений между случайными величинами. В основополагающих работах Джудеи Перл [@ Pearl88] и Стивена Лауритцена [@ lauritzen1992propagation] о вероятностных графических моделях (PGM) вероятностное моделирование рассматривается как незаменимый инструмент для решения многих проблем, связанных с любой формой неопределенности в самых разных областях, таких как искусственный интеллект [ @..