Как выполнить развертывание в MCTS в сложных играх

Хорошо, я в основном понимаю, как MCTS работает с выбором узла и т. Д. Чего я не понимаю, так это случайной фазы развертывания. Верно ли, что я случайным образом имитирую будущие шаги игры, пока она не закончится победой или поражением? Разве развертывание не занимает много времени из-за более сложных игр со многими состояниями, возможными действиями и неизвестными движениями противника? Если вы случайным образом выкатываете ходы противника, пока не дойдете до конца игры, разве не так же хорошо просто возвращать победу или поражение случайным образом? Я был бы рад, если бы кто-нибудь мог объяснить фазу развертывания на простом примере, таком как игра из 3 или 4 шагов.

Заранее спасибо.


person user1090755    schedule 05.01.2013    source источник
comment
о, я вижу, могут быть Игры, в которых одна сторона может только предотвратить проигрыш, а другая не может проиграть. Вернуть случайную потерю означало бы вернуть невозможный конец. Спасибо за это.   -  person user1090755    schedule 07.01.2013
comment
Я хочу прокомментировать последнее предложение принятого ответа. Наличие более информированных развертываний по сравнению со случайными не означает повышения производительности. Случайные развертывания обеспечивают разнообразие и менее предвзяты, несмотря на высокую дисперсию.   -  person bkartal    schedule 23.07.2018


Ответы (1)


Имитация случайной игры более информативна, чем случайный возврат выигрыша или проигрыша.

Представьте себе доску TicTacToe, где один цвет больше не может побеждать, а другой может. Очевидно, случайные выкатывания могут выявить этот факт.

Кроме того, обычно имеется фактическая информация о вероятности того, что выборка дает определенный результат. Ситуация, в которой вы выигрываете 90% всех случайных розыгрышей, может быть предпочтительнее, чем ситуация, когда вы выигрываете только 10% всех случайных розыгрышей. Конечно, это нельзя утверждать в общем. Одна ветвь может содержать определенный выигрыш только в том случае, если разыгрывается единственный правильный ответ — и эта же ветвь может иметь множество возможных путей к поражению.

Также одним из возможных улучшений MCTS является более разумное, чем случайное воспроизведение.

person ziggystar    schedule 08.01.2013