Количественная оценка влияния игрока на выигрышные раунды в Pro Counter Strike

Пропустить разглагольствования

Отказ от ответственности

В наборе данных и некоторых данных, использованных в этой статье, есть несколько известных ошибок. В основном нестыковки с лигами, использующими нестандартную демо-запись. Он минимален, поэтому не должен влиять на лежащую в основе идею Round Impact, к которой я все равно вернусь в будущем. Из 572 карт за последние 6 месяцев 479 были автоматически проанализированы и учтены. У оставшихся 93 либо были проблемы с медиками матча, либо технические паузы, и они были исправлены вручную, но всегда есть место для ошибки.

Проблема данных

Данные — один из главных двигателей современного мира. Новейшая волна технологий связана с искусственным интеллектом, который требует огромных объемов данных. На первый взгляд, можно подумать, что в киберспорте будет легко доступно такое огромное количество данных, но по сравнению с более традиционными видами спорта это далеко не так. Когда я рос в Канаде, я имел дело с четырьмя профессиональными спортивными лигами: хоккеем, бейсболом, баскетболом и американским футболом. Если бы я хотел найти почти любую статистику по этим лигам, мне не пришлось бы искать далеко, когда существуют такие сайты, как https://www.sports-reference.com/, не говоря уже о многих других сайтах, таких как https. ://moneypuck.com/» или https://www.statmuse.com/. Киберспорт, по своей природе являющийся электронным видом спорта, проводится на каком-то компьютере, поэтому не должно быть легко собрать все эти данные? Традиционные виды спорта должны иметь какой-то интерфейс с физическим миром для сбора данных (НХЛ использует 5 человек на каждой игре для записи таких событий, как удары, броски и т. д.), и все же они справляются. В настоящее время лучшее, что у нас есть, это https://www.hltv.org/, их рейтинг очень шаблонный, хотя фактическая формула не подтверждена, она дает очень удобоваримое число, на которое можно посмотреть, чтобы количественно оценить влияние. Недостатком рейтинга HLTV является то, что число само по себе ничего не значит, оно ничем не обосновано. Какое влияние оказывает игра с рейтингом 1,3 по сравнению с игроком с рейтингом 1,1? Откуда мы знаем, что статистика, которая входит в высокий рейтинг, означает лучшего игрока? Чтобы ответить на такие вопросы, я собираюсь сравнить рейтинг HLTV с чем-то более поддающимся количественной оценке, шансом на победу в раунде. Первичный набор данных, используемый в этой статье, можно скачать здесь.

Проблема азартных игр

Я буду краток здесь. Азартные игры управляют киберспортом. Никаких азартных игр, никакого профессионального Counter-Strike, каким мы его знаем сегодня. Что нужно, чтобы получить преимущество в книгах? Данные. Чем сложнее получить данные, тем сложнее принимать обоснованные решения и прибыльные модели. Со временем я напишу статью о моделях азартных игр (AWS не окупает себя), но пока мне кажется, что почти невозможно получить надежные, подробные и полезные данные о профессиональных играх.

Почему важно измерять влияние

Наиболее распространенным типом споров о спорте и киберспорте является сравнение игроков и команд. Сделала ли Team Z правильный ход в составе? Игрок А лучше игрока Б? Должна ли команда X победить команду Y? У многих людей будет много разных мнений, основанных на разных идеалах игры. Некоторые игроки получают высокие оценки, потому что они всегда в центре внимания, совершая роскошные убийства. Некоторые получают высокие оценки за свои ледяные вены, выигрывая бесчисленные клатчи. Возникает вопрос, какой плеер лучше? Другими словами, если предположить, что целью каждой команды является победа (99,99% команд), какой игрок оказывает большее влияние на шансы своей команды на победу? Изначально можно подумать, что достаточно посмотреть, у кого больше всего убийств, чтобы определить влияние игрока, но это поверхностный взгляд. Такие статистические данные, как количество убийств, говорят нам о том, что на самом деле произошло, а не о том, что должно было произойти. Это связано с большой ролью, которую случайностьиграет в Counter Strike.

Удача розыгрыша

Удерживая тактику и товарищей по команде (намного сложнее, может быть, в другой раз), раунд Counter Strike по своей основе можно свести к серии дуэлей, каждая из которых содержит мини-игру Камень, ножницы, бумага, или как это называется в файтинги, выбор варианта. В Counter Strike некоторые варианты включают в себя покачивание против широкого пика, сухую против использования утилиты против игры против вспышки, и пик из разных мест, чтобы назвать несколько. Эти различные варианты привносят элемент удачи, так как у каждого участника будут разные HP, экипировка, позиция и т. д. Учитывая все это, игрок может быть полностью прошит, на 1 HP, и все равно получить убийство из-за удачного спрея или хорошего размещение перекрестия. Чтобы определить, какой игрок или команда являются лучшими, мы должны удалить этот элемент удачи. Как и в другой статье, которую я написал, мы можем использовать модель, чтобы увидеть, как средний профессионал будет работать в заданном сценарии. Как только удача удалена, мы можем увидеть, кто находится в наилучшем положении для достижения успеха (ожидаемое количество убийств, xK), и кто преуспевает больше всего по сравнению с их ситуациями (убийства выше ожидаемого, K/xK). Тем не менее, не все убийства создаются одинаково, некоторые из них, по большому счету, бесполезны. Убийство спасающегося игрока, вся команда которого мертва, вряд ли окажет влияние, тогда как клатч 1 на 1, безусловно, окажет влияние. Оба по одному убийству, одно с гораздо большим смыслом. Опять же, мы можем использовать модель, чтобы увидеть, как дуэль повлияла на шансы команд на победу в раунде (Round Impact, RI). Объедините ожидаемые убийства и удар по раунду вместе, и вы сможете рассчитать, учитывая ситуации, в которых находился игрок, насколько хорошо по сравнению со средним профессионалом игрок помог своей команде выиграть шансы (Ожидаемый удар по раунду, xRI). У xRI есть несколько проблем, над которыми я работал, в основном из-за альтернативного мира, в котором человек, проигравший дуэль, побеждает, поэтому я не буду сейчас слишком на этом сосредотачиваться.

Самый очевидный и простой для понимания вариант использования Round Impact — это графическое отображение его по раундам, чтобы получить визуализацию того, как проходил раунд. Каждая точка является убийством и выглядит так:

Здесь мы видим некоторую информацию об убийстве, когда оно произошло в раунде, какая сила команды, ожидаемое значение убийства, значение удара раунда и вероятность удаленного аналога.

Но, конечно же, эта статья посвящена количественной оценке влияния игроков и измерению их навыков. Так что в оставшейся части этой статьи я в основном сосредоточусь на Round Impact. Для чего формализовать определение: в данном раунде, насколько сильно игрок повлиял на шансы своей команды на победу в указанном раунде, выраженные в процентах, или, если рассматривать его в течение многих раундов, как дуэли игроков повлияли на шансы их команд на победу. выигрыш. Например, лидер ZywOo в 4,88 раунда после PGL Antwerp 2022 означает, что в среднем раунде ZywOo увеличит шансы своей команды на победу в раунде на 4,88%.

Военные игры

Теперь пришло время проверить реальность. Статистика, которая количественно определяет влияние игрока, уже существует в традиционных видах спорта, в основном в WAR (победы выше замены) как в MLB, так и в НХЛ.

График слева от Justin Bopp стал классической диаграммой, когда речь идет о WAR, а график справа от EvolvingWild — ее версия для НХЛ. Итак, давайте сделаем версию CSGO.

Мы видим, что распределения очень похожи, разделение групп игроков на разные категории также показывает схожие результаты. Мы также можем сравнить Round Impact с HLTV Rating 2.0, широко используемой в настоящее время «оценкой воздействия»:

На этом графике сравнивается рейтинг игроков HLTV с их Round Impact в одних и тех же играх. Корреляция среднего размера, но полезно посмотреть, где они расходятся. Мне кажется, что есть одно главное место, где статистика может расходиться. Оценка удара — это вход в формулу HLTV Rating 2.0, которая «измеряет влияние множественных убийств, открывающих убийств и захватов», что очень резко и сухо, например, 2 на 2, где у одной команды 10 комбинированных хп против 200 комбинированных хп. намного проще, чем 2 на 2 на ровной поверхности, но кажется, что рейтинг 2.0 не различает, но я могу ошибаться. Round Impact — это более детализированная версия рейтинга воздействия, учитывающая контекст раунда.

Заключение

Я думаю, что корреляция между рейтингом HLTV и значением Round Impact подтверждает достоверность рейтинга HLTV как квантификатора влияния игрока. Это не говорит всей истории, но тот факт, что Round Impact имеет тенденции наряду с рейтингом, подтверждает это. HLTV Rating также имеет большое преимущество, заключающееся в том, что ему нужны только сводные статистические данные, что значительно упрощает расчет практически для всех (если вы знаете формулу). Вы даже можете использовать их вместе, как я сделал с Кэрриган. Если у кого-то высокий рейтинг Round Impact, но низкий рейтинг HLTV, возможно, ему не приписывают некоторые части его игры. Высокий рейтинг HLTV, но низкое влияние раунда? Может быть, они фармят убийства с низким уровнем воздействия или экономят больше, чем должны были. В будущем планируется протестировать HLTV Rating 2.0, используя RI в качестве входных данных Impact Score.

Я не хочу на это претендовать, просто некоторые идеи, которые у меня были в рамках моего более крупного проекта по созданию cs-reference.com, который, я надеюсь, будет полезен для рассказывания историй и документальных фильмов в будущем. Я сделал данные доступными, так что продолжайте исследовать их самостоятельно (и, возможно, помогите обнаружить некоторые ошибки :D).