Происхождение: Что побудило меня построить все это?

По данным Evolving-Hockey.com, хоккеисты Миннесота Уайлд лидировали в НХЛ по количеству голов выше замены (GAR) в регулярном сезоне 2019–2020. Другими словами, их расчеты, которые изолируют производительность команды путем поправки на контекстуальные факторы, такие как сила графика и игра вплотную, а также отделяют игру вратарей команды от их полевых игроков, привели к выводу, что если вы замените каждого игрок в Minnesota Wild с игроком уровня замены (легко заменяемый игрок, который находится ниже 13-го нападающего, 7-го защитника или 2-го вратаря в таблице своей команды), то их разница мячей упадет на большее число, чем если бы вы это сделали то же самое для любой другой команды в НХЛ. Говоря более кратко: по этой модели, не считая вратарской игры, Миннесота Уайлд была лучшей командой НХЛ в регулярном сезоне 2019–20.

Если вы не знакомы с целями выше замены, я кратко изложу некоторые основы: это очень эффективная модель, созданная EvolvingWild, которая позволяет нам улучшить нашу оценку игроков, изолируя индивидуальный вклад игрока от различных внешних факторов, таких как конкуренция, товарищи по команде , и использования, а затем сравнивая их вклад с вкладом типичного игрока уровня замены и определяя, какую ценность они добавили. Модель построена с нуля на уровне отдельных игроков, а командные значения представляют собой просто агрегированные значения игроков, но статистика также подходит для использования на командном уровне. С 2007–2008 гг. команды, забившие больше голов в регулярном сезоне, чем замены, выиграли 60,5% своих серий плей-офф, в то время как команды с более высоким рейтингом в регулярном сезоне выиграли только 55,9% своих серий, что показывает, что модель обладает надежной прогностической силой, даже если она строится, чтобы носить описательный характер. Я не буду вдаваться в подробности, но это отличная модель, которая, возможно, лучше отражает ценность игрока, чем любая другая хоккейная статистика, существующая в настоящее время. Вы можете прочитать об этом более подробно из этой серии из 3-х частей, написанной создателями модели:



Теперь вернемся к дикой природе. Может показаться немного удивительным, что их фигуристы заняли первое место по количеству забитых голов выше замены, учитывая, что они также заняли 19-е место по разнице мячей и 21-е место по проценту очков. Если мы предположим, что модель валидна и точна — что мне удобно делать — тогда расхождение между результатами модели и реальными результатами можно объяснить только двумя факторами:

  1. У «Уайлд» был самый напряженный график в лиге, они играли один за другим каждые две ночи исключительно против лучших команд лиги.
  2. Вратари «Уайлд» были настолько ужасны, что опустили настоящего претендента на Кубок Стэнли на 21-е место.

Судя по самой модели, в основном последнее. Их вратари заняли последнее место с меньше забитыми голами на 6,8 гола. Это означает, что если вы возьмете типичного вратаря третьей линии и поместите его в ворота Уайлда, их разница мячей улучшитсяпримерно на семь голов. Это намного хуже, чем у второй худшей группы вратарей, которые принадлежали «Детройт Ред Уингз» и забили на 1,2 гола меньше замены. Эти цифры не совсем легко сопоставить по проценту сохранений; У вратарей Миннесоты общий процент бросков составил 90,25%, а у вратарей Детройта общий процент бросков составил 89,36%. Так как же Evolving Hockey подсчитал, что в Детройте вратари значительно лучше?

Ответ кроется в настройках качества выстрела. Evolving Hockey рассчитывает вероятность того, что бросок по воротам или пропущенный бросок станет голом, на основе различных факторов, таких как заявленное расстояние от ворот (самый важный фактор на сегодняшний день), сообщенный угол от ворот и сила игры, чтобы рассчитать вероятность каждый бросок становится голом, и присваивает этому броску значение «ожидаемого гола» в зависимости от вероятности того, что он станет голом. (Для примера: опасный бросок с вероятностью 35 % будет иметь ожидаемое значение гола 0,35.) Их расчеты показали, что средний бросок, с которым столкнулись вратари Миннесоты, был значительно меньшеменьше может быть голом, чем средний удар, с которым сталкиваются вратари Детройта — настолько, что, если учесть качество этих ударов, вратари Детройта выглядят намного лучше, несмотря на их низкий процент бросков. Интуитивно это имеет смысл. Мы знаем, что самым большим фактором, определяющим вероятность того, что удар станет голом, является расстояние до сетки. Мы также знаем, что средняя дистанция удара по воротам, с которой столкнулись вратари «Детройта», составляла 32,2 фута от сетки, в то время как средняя дистанция удара по воротам, с которой столкнулись вратари «Миннесоты», составляла 36,69 фута от сетки. Итак, вот оно: «Уайлд» просто нужно улучшить вратарскую игру, и они станут лучшей командой в лиге. Правильно?

Ну, не совсем так. Хотя верно то, что вратари Миннесоты в среднем сталкивались с более легкими бросками, чем вратари Детройта, правда и то, что статистика, которую я только что перечислил, может не отражать того, что произошло на самом деле. Если вы внимательно перечитаете предыдущий абзац, то увидите, что я позаботился указать, что это была зарегистрированная дистанция каждого удара по воротам. Я делаю это различие, потому что у меня есть достаточно оснований полагать, что секретари Xcel Energy Center (домашняя арена «Миннесоты») сообщили, что эти удары по воротам были нанесены немного дальше от сетки, чем на самом деле, и что эти секретари делают то же самое для ударов. которые пропускают сеть.

Примечание. В оставшейся части этой статьи я буду использовать термин «удар» для обозначения не только ударов по воротам, но и ударов, которые не попали в сетку. Эти удары известны в аналитическом сообществе как Fenwicks (названы в честь аналитика Мэтта Фенвика), и я использую их вместо ударов по воротам, потому что я считаю, что форсированные удары и попадание в сетку ударами — это навыки, которыми обладают соответственно вратари и полевые игроки. Я хочу воздать должное тем, кто проявляет мастерство в этих навыках, и наказать тех, кто этого не делает.

Теперь вернемся к дикой природе: может показаться жестоким обвинение секретарей Миннесоты в том, что они плохо выполняют свою работу, но доказательств слишком много, чтобы просто отмахнуться от них. В каждом из последних тринадцати сезонов НХЛ средняя дальность броска в домашних матчах «Миннесоты» на обоих концах площадки была значительно дальше от сетки, чем средняя дальность броска в их выездных играх. Вот цифры для каждого из этих сезонов, отображаемые рядом со средними показателями по лиге, чтобы дать вам представление о распределении:

На выезде стиль игры «Миннесоты» колебался между игрой чуть ближе к периметру, чем в среднем по лиге, и игрой чуть ближе к сетке, чем в среднем по лиге, но большого расхождения никогда не было. На протяжении всего этого времени средняя заявленная дистанция выстрела в выездных играх Миннесоты составляет 34,69 фута, в то время как средняя зарегистрированная дистанция выстрела во всех играх НХЛ составляет… 34,69 фута. Для сравнения, средняя заявленная дистанция выстрела в домашних играх Миннесоты составляет 37,27 фута.

Это не просто какой-то разовый случай; это явление сохраняется из года в год в выборке из более чем 500 домашних игр, более 500 выездных игр и более 15 000 игр НХЛ в целом.

Один веский контраргумент ошибочной гипотезе подсчета очков заключается в том, что «Уайлд» просто играет дома в другом стиле, чем на выезде. Возможно, они сжимаются и меньше рискуют дома, где чувствуют, что могут контролировать ход игры, но на выезде они играют в более типичном стиле соперника. Это возможно, но также очень маловероятно, что эта тенденция сохранится в течение тринадцати сезонов подряд. Это становится еще менее вероятным, если учесть, что за эту выборку отвечали четыре генеральных менеджера и шесть разных главных тренеров, и каждый из них, вероятно, использовал разные стратегии. В каждом из этих сезонов, независимо от того, кто руководил командой, средняя дальность броска в их выездных играх никогда не отклонялась более чем на 1,5 фута от средней лиги в любом направлении, в то время как средняя дальность броска в их домашних играх всегда был более чем на 1,5 фута вышесреднего показателя лиги. Таким образом, хотя мы не можем быть на 100% уверены, что счетчики Миннесоты неправильно отслеживают данные о выстрелах, это гораздо более правдоподобно и требует значительно меньше предположений, чем любой другой вывод. Имея это в виду, я буду двигаться вперед с предположением, что секретари Миннесоты действительно демонстрируют модель ошибочного отслеживания ударов дальше от ворот, чем они есть на самом деле, и я буду называть эту модель поведения ». предвзятость счетчика».

Теперь, когда мы заложили основу для предвзятости секретаря и согласились работать дальше, исходя из предположения, что она действительно существует, следующий вопрос заключается в том, как именно это влияет на цели Evolving Hockey выше рейтинга замены Minnesota Wild. Ответ на этот вопрос — защита. На уровне полевого игрока защитные компоненты этой метрики в основном количественно оцениваются через ожидаемые голы, и, как мы рассмотрели, наибольшая часть этой статистики — это заявленная дальность разрешенных бросков. Если секретари Миннесоты сообщают, что броски находятся дальше от сетки, чем на самом деле, то ожидаемая ценность бросков, допускаемых их полевыми игроками, будет ниже, чем «истинная» вероятность того, что эти броски станут голами, и, следовательно, будет казаться, что эти полевые игроки лучше сдерживают ожидаемые голы, чем они есть на самом деле.

Вот еще один способ визуализировать это: представьте, что игрок соперника делает бросок в прорезь. Если этот бросок правильно записан, модель ожидаемого гола может рассчитать, что вероятность забитого гола составляет 25%, и этому броску будет присвоено соответствующее значение ожидаемого гола, равное 0,25. Но если секретари Миннесоты зарегистрируют это как бросок из-за пределов круга, модель ожидаемого гола может использовать указанное расстояние, чтобы рассчитать, что вероятность забитого гола составляет всего 10%, а броску будет присвоено только значение ожидаемого гола, равное 0,1. Это неточно польстило бы оборонительным характеристикам фигуристов из Миннесоты, предполагая, что они допустили менее опасный удар, чем на самом деле. И если бы вратарь «Миннесоты» пропустил гол при этом броске, ему бы ошибочно засчитали голы на 0,9 гола ниже ожидаемого, а не на 0,75 гола ниже ожидаемого. Звучит не очень много, но в течение сезона или многих сезонов это составляет очень значительную цифру:

Как видите, Миннесота абсолютно страдает от плохой игры вратарей. Но эта проблема усугубляется предвзятостью счетоводов, которой нет, когда они играют на выезде.

Что с обидой? Разделение «Миннесоты» дома и на выезде в приведенных выше таблицах показывает удары для обеих команд, а это означает, что секретари Миннесоты также сообщают, что удары, сделанные «Уайлд» дома, находятся дальше от ворот, чем на самом деле. Таким образом, логически следует, что ожидаемые значения голов для бросков Миннесоты также будут неточно низкими, и поэтому их атакующая способность генерировать опасные броски должна быть переоценена примерно в той же степени, в которой переоценена их защитная способность подавлять опасные броски, верно? Та же визуализация сверху, когда мы смотрим на забитые голы, а не на сохраненные, выше ожидаемых дома и на выезде, подтверждает это:

Как видите, скейтеры из Миннесоты дома выглядят как элитные стрелки, но на выезде стреляют немного хуже среднего. Логически говоря, можно предположить, что эти вопросы по существу уравновешивают друг друга. И они вроде как делают; ожидаемые голы с обеих сторон площадки одинаково сбалансированы. Но в отличие от защиты, голы выше замены измеряют вклад в атаку, используя фактические голы, а не ожидаемые голы. А поскольку НХЛ проверяет каждый гол, чтобы убедиться, что он попал в сетку, предвзятость секретаря не будет иметь значения для реальных голов. Теоретически, если вайлд демонстрирует среднее мастерство забивать голы, не имеет значения, сделали ли они это за счет плохого количества ударов и отличной стрельбы или наоборот; их голы в атаке выше замены будут голами средней команды.

Однако в этом сезоне «Миннесота» не была среднестатистической атакующей командой. Они были значительно выше среднего. Это может вас удивить (и меня это удивило), но Миннесота на самом деле заняла пятое место по количеству голов 5 на 5 в час и десятое место по количеству голов в игре в большинстве. Это соответствует их рейтингу по количеству голов выше замены: пятое место в компоненте нападения с равной силой и девятое место в компоненте нападения в большинстве. Учитывая эту информацию, я могу с уверенностью сказать, что эта модель дает им право на нападение, и что защита — единственная проблема с этой конкретной моделью.

Прежде чем мы двинемся дальше, давайте вспомним, с чего мы начали: «Развитие хоккея с голами выше замен» — это очень эффективный показатель оценки, который утверждает, что в регулярном сезоне НХЛ 2019–2020 годов у «Миннесота Уайлд» были лучшие фигуристы в лиге и худшие вратари в лига. Но у нас есть основания с большой уверенностью полагать, что секретари домашней арены «Миннесоты» постоянно сообщали, что удары были немного дальше от сетки, чем на самом деле, и мы знаем, что если они делают это, тогда голы выше замены будут переоценивать защитные характеристики полевых игроков Миннесоты за счет их вратарей, без штрафа за их нарушение.

Хотя я сосредоточился исключительно на счетоводах в XCel Energy Center, они не единственные, кто проявляет предвзятость. Они даже не самые злостные нарушители. Исторически сложилось так, что злейшими нарушителями на сегодняшний день были секретари Мэдисон-Сквер-Гарден, которые поступали иначе, чем секретари из Миннесоты, и сообщали, что броски ближек сетке, чем они, и которые почему-то даже менее точны, чем секретари Миннесоты. Кроме того, в то время как «Мэдисон-Сквер-Гарден» фактически улучшила свои проблемы за последние два сезона, «Миннесота» до сих пор не имеет даже самого большого расхождения между дистанцией броска дома и на выезде.

Как видите, абсолютное значение разницы между средним расстоянием броска дома и на выезде на самом деле больше для «Филадельфия Флайерз», которые играют свои домашние матчи в Wells Fargo Center, чем для «Уайлд». Даллас, Анахайм и Чикаго тоже рядом. Может ли быть так, что большинство катков в той или иной степени склонны к предвзятости судей? Следующая визуализация предполагает, что это может иметь место:

Как видите, команды показывают гораздо большую разницу в средней дальности броска, когда они играют дома, чем на выезде. На выезде среднее расстояние выстрела для каждой команды находится в узком диапазоне от 32,5 футов до 35,5 футов, в то время как дома команды попадают в гораздо большую зону от 30,5 футов до 37,5 футов. Кроме того, дисперсия для домашнего расстояния составляет 2,06 фута, а для дальнего – всего 0,31 фута!

Таким образом, будет справедливо сказать, что Xcel Energy Center в Миннесоте, вероятно, не единственный каток, который страдает от предвзятости счетоводов. Я думаю, логически имеет смысл, что здесь играет роль человеческая ошибка, и что большинство счетоводов делают вещи, немного отличающиеся от других секретарей. В идеальном мире у нас были бы счетчики, путешествующие по разным аренам, чтобы рандомизировать эту проблему, но этот мир не идеален, и это повлечет за собой большие транспортные расходы, поэтому мы должны обходиться данными, которые у нас есть.

Я также должен отметить, что я не единственный человек, который определил это, и я далеко не первый. В 2007 году мне было десять лет, когда Алан Райдер выпустил Уведомление об отзыве продукции в связи с «качеством снимков», в котором представил эту проблему и заявил:

у нас явно есть проблема предвзятости оценщика RTSS. Проблема кажется серьезной в Мэдисон-Сквер-Гарден, но явно нетривиальной в других местах. НХЛ нужно серьезно взглянуть на последовательность этого процесса.

Многие другие хоккейные аналитики определили, что это проблема, и представили дополнительные доказательства в поддержку своей позиции. Совершенно очевидно, что предвзятость счетоводов в НХЛ — это настоящее явление.

Теперь, когда мы установили, что в XCel Energy Center существует предвзятость счетоводов, объяснили, как это приводит к неточной оценке полевых игроков и вратарей Minnesota Wild, и установили, что XCel Energy Center — не единственная арена, где существует предвзятость счетоводов, это только логически Отсюда следует, что оценка многих других полевых игроков и вратарей может быть переоценена или недооценена из-за предвзятости счетовода. Например, средний бросок в играх «Анахайм Дакс» в Honda Center за последние два года, как сообщается, на 2,56 фута ближек воротам, чем средний бросок в выездной игре «Анахайм Дакс». над этим образцом. Если эта цифра на самом деле является результатом неточных данных о расстоянии броска, то из этого логически следует, что оборонительные характеристики «Анахайма» будут недооценены, а их вратарская деятельность — переоценена. То же самое верно и для Далласа, и то же самое верно, наоборот, для Филадельфии. Суть здесь в том, что предвзятость счетовода приводит к некоторым неточным оценкам полевого игрока и вратаря, особенно в случае голов выше замены.

Как это исправить? Ну, я нет. Я не делал модель, и не мне решать, как исправить то, что я считаю проблемой. Даже не мне решать, это проблема или ее нужно исправить. То, что я хочу сделать здесь, это просто дать оценку того, насколько влияние предвзятости секретаря может искажать то, что на самом деле делают фигуристы и вратари на льду, и позволить нам помнить об этом предполагаемом влиянии при анализе целей Evolving Hockey. указанные выше замены и другие расширенные хоккейные статистические данные, в которых используется ожидаемое количество голов и не учитывается влияние предвзятости секретаря.

Для этого я сделаю три вещи:

  1. Создайте модель ожидаемого гола, которая достаточно хорошо работает при тестировании, чтобы мне было удобно использовать ее в качестве описательной модели для оценки качества уже выполненных бросков.
  2. Определите поправку на погрешность счетчика, которая не повлияет на эффективность моей модели ожидаемого количества голов, когда я заменю полученные данные о расстоянии удара скорректированным расстоянием удара, которое я рассчитал.
  3. Построить регуляризованную скорректированную модель плюс-минус (RAPM), которая позволит мне дать точечную оценку отдельных действий игрока в нападении, защите и чистом влиянии на ожидаемые голы. Я сделаю это, потому что голы выше замены используют изолированное влияние игрока на ожидаемые голы по сравнению с моделью RAPM Evolving Hockey в качестве одного из основных компонентов для оценки защиты полевого игрока, и большинство других компонентов, которые они используют, очень тесно коррелируют с этим показателем. Таким образом, RAPM обеспечит надежную оценку вклада полевого игрока в защитный компонент голов выше замены. (Кроме того, RAPM также используется многими болельщиками и аналитиками сам по себе в качестве инструмента для оценки полевых игроков, и точечная оценка атакующего воздействия игрока на ожидаемые голы имеет больший вес в этом случае, чем в голах выше замены.)

Конечная цель этого процесса будет состоять в том, чтобы дать одну точечную оценку изолированного атакующего, оборонительного и чистого удара полевого игрока с использованием сообщаемой дистанции удара, одну точечную оценку изолированного атакующего, оборонительного и чистого удара игрока с использованием скорректированного расстояния удара, а затем отображать их рядом друг с другом, чтобы дать оценку того, как поправка на предвзятость секретаря может повлиять на изолированное влияние игрока или команды в соответствии с одной из этих моделей. Я также хочу сделать то же самое для вратарей, предоставив одну оценку изолированной работы вратаря с использованием сообщаемой дистанции удара и одну оценку изолированной работы вратаря с использованием скорректированной дистанции удара. Моя гипотеза заключается в том, что такие вратари, как Алекс Сталок из Миннесоты и Деван Дубник, изображенные на изображении в этой статье, будут выглядеть значительно лучше после поправки на предвзятость статистиков.

Во второй части я расскажу об этом процессе. Быть в курсе.