Как выполнить развертывание в MCTS в сложных играх

Хорошо, я в основном понимаю, как MCTS работает с выбором узла и т. Д. Чего я не понимаю, так это случайной фазы развертывания. Верно ли, что я случайным образом имитирую будущие шаги игры, пока она не закончится победой или поражением? Разве развертывание не занимает много времени из-за более сложных игр со многими состояниями, возможными действиями и неизвестными движениями противника? Если вы случайным образом выкатываете ходы противника, пока не дойдете до конца игры, разве не так же хорошо просто возвращать победу или поражение случайным образом? Я был бы рад, если бы кто-нибудь мог объяснить фазу развертывания на простом примере, таком как игра из 3 или 4 шагов.

Заранее спасибо.

user1090755 05.01.2013 источник

comment

о, я вижу, могут быть Игры, в которых одна сторона может только предотвратить проигрыш, а другая не может проиграть. Вернуть случайную потерю означало бы вернуть невозможный конец. Спасибо за это. - user1090755 07.01.2013

comment

Я хочу прокомментировать последнее предложение принятого ответа. Наличие более информированных развертываний по сравнению со случайными не означает повышения производительности. Случайные развертывания обеспечивают разнообразие и менее предвзяты, несмотря на высокую дисперсию. - bkartal 23.07.2018

Ответы (1)

arrow_upward
4
arrow_downward

Имитация случайной игры более информативна, чем случайный возврат выигрыша или проигрыша.

Представьте себе доску TicTacToe, где один цвет больше не может побеждать, а другой может. Очевидно, случайные выкатывания могут выявить этот факт.

Кроме того, обычно имеется фактическая информация о вероятности того, что выборка дает определенный результат. Ситуация, в которой вы выигрываете 90% всех случайных розыгрышей, может быть предпочтительнее, чем ситуация, когда вы выигрываете только 10% всех случайных розыгрышей. Конечно, это нельзя утверждать в общем. Одна ветвь может содержать определенный выигрыш только в том случае, если разыгрывается единственный правильный ответ — и эта же ветвь может иметь множество возможных путей к поражению.

Также одним из возможных улучшений MCTS является более разумное, чем случайное воспроизведение.

ziggystar 08.01.2013

Как выполнить развертывание в MCTS в сложных играх

Ответы (1)

Вопросы по теме