Хорошо, я в основном понимаю, как MCTS работает с выбором узла и т. Д. Чего я не понимаю, так это случайной фазы развертывания. Верно ли, что я случайным образом имитирую будущие шаги игры, пока она не закончится победой или поражением? Разве развертывание не занимает много времени из-за более сложных игр со многими состояниями, возможными действиями и неизвестными движениями противника? Если вы случайным образом выкатываете ходы противника, пока не дойдете до конца игры, разве не так же хорошо просто возвращать победу или поражение случайным образом? Я был бы рад, если бы кто-нибудь мог объяснить фазу развертывания на простом примере, таком как игра из 3 или 4 шагов.
Заранее спасибо.