Выходя за рамки голов и бросков: представляем комплексный подход к анализу результативности футболиста

Вы любитель футбола и вам интересно, как оцениваются действия игроков на поле? Хотите узнать о новом языке для описания действий отдельных игроков и системе оценки действий игроков любого типа? Если да, то не пропустите исследовательскую работу «Действия говорят громче, чем цели: оценка действий игроков в футболе». В статье рассматриваются недостатки традиционных метрик в оценке результативности игроков путем введения нового языка для описания действий отдельных игроков на поле и основы для оценки любого типа действий игрока на основе их влияния на результат игры с учетом контекста, в котором действие произошло. Путем суммирования значений действий футболистов можно количественно оценить их общий вклад в нападении и защите своей команды. В документе показано, как их подход учитывает релевантную контекстную информацию, которую игнорируют традиционные метрики оценки игроков, и представлен ряд вариантов использования, связанных с разведкой и характеристикой стиля игры в сезонах 2016/2017 и 2017/2018 в ведущих европейских соревнованиях.

Введение

В данной исследовательской работе делается попытка ответить на вопрос о том, как действия футболиста влияют на результативность его команды во время игр. Хотя этот вопрос важен для привлечения, оценки, поиска игроков, освещения в СМИ и взаимодействия с болельщиками, количественно оценить влияние отдельных действий сложно из-за низкой результативности и динамичного характера футбольных игр. В документе утверждается, что большинство существующих подходов к оценке действий в футболе страдают от трех ограничений: они сосредоточены на голах и бросках, присваивают фиксированную ценность действиям независимо от обстоятельств и учитывают только немедленные последствия, а не долгосрочные. последствия.

Чтобы устранить эти ограничения, в документе предлагается новая структура, основанная на данных, для оценки всех типов действий игроков и учета обстоятельств, при которых они происходят, а также их возможных долгосрочных последствий. Подход присваивает значение каждому действию, отражающему его ожидаемое влияние на счет, причем положительные значения указывают на вклад в достижение целей команды, а отрицательные значения указывают на вклад в достижение целей соперника.

В документе представлены пять вкладов:

  1. Язык для представления действий игрока
  2. Система оценки действий игроков и рейтинга игроков на основе их влияния на игру.
  3. Модель для прогнозирования краткосрочных вероятностей забитых и пропущенных мячей в любой момент игры.
  4. Варианты использования, демонстрирующие интересные результаты и идеи
  5. Пакет Python, который преобразует существующие данные потока событий в предлагаемый язык, реализует структуру и создает модель, которая оценивает вероятность выигрыша и пропуска.

В целом, статья направлена ​​на объективную количественную оценку результатов игроков и предоставление ценной информации футбольным клубам, СМИ и болельщикам.

SPADL: язык описания действий игрока.

В этом разделе обсуждаются источники данных, доступные для футбольных матчей, и объясняется, что существует два основных источника данных: данные потока событий и оптические данные отслеживания. Хотя данные отслеживания стоят дорого и доступны только в богатых лигах или клубах, данные о потоках событий доступны более широко и дешево. Таким образом, в этой статье основное внимание уделяется данным потока событий, которые аннотируют время и место определенных событий, таких как передачи, удары и карты, которые происходят в игре. Однако анализ данных потока событий создает несколько проблем с точки зрения науки о данных, и в этом разделе эти проблемы подробно обсуждаются. Для решения этих проблем в документе предлагается использовать новый язык под названием SPADL, что означает «Язык описания действий футболиста». Этот язык обеспечивает стандартизированный способ описания действий. действия игроков в футбольных играх и позволяет исследователям извлекать более подробные сведения из данных. В заключение раздела отмечается, что хотя предлагаемый язык был разработан для данных потока событий, его также можно применять для отслеживания данных с некоторыми незначительными расширениями.

Пять проблем науки о данных, связанных с текущими данными потока событий

В документе описываются пять проблем науки о данных, связанных с текущими данными потока событий. Первая проблема заключается в том, что данные потока событий предназначены для нескольких целей, а это означает, что некоторая важная информация может отсутствовать, а нерелевантная информация может затруднить анализ данных. Вторая проблема заключается в том, что каждый поставщик использует свою собственную уникальную терминологию и определения для описания событий, что затрудняет анализ данных от разных поставщиков. Третья проблема заключается в том, что форматы потоков событий поставщиков обычно остаются обратно совместимыми с предыдущими форматами, что может привести к неоптимальному выбору дизайна и громоздким запросам данных. Четвертая проблема заключается в том, что поставщики предлагают дополнительные фрагменты информации для каждого события, что затрудняет применение инструментов автоматического анализа. Наконец, большинству алгоритмов машинного обучения требуются векторы признаков фиксированной длины, и они не могут работать с векторами переменного размера, поэтому аналитикам приходится писать сложные препроцессоры событий, адаптированные к текущему формату потока событий одного конкретного поставщика.

Описание языка

Авторы предлагают SPADL (язык описания действий футболиста), язык описания действий игрока, чтобы объединить существующие форматы потока событий в общий словарь, позволяющий последующий анализ данных. SPADL разработан таким образом, чтобы его можно было интерпретировать человеком, он был простым и полным, чтобы точно определять и описывать действия на поле. Он различает действия и события и представляет игру как последовательность действий с мячом с девятью атрибутами, включая время и место начала и окончания, игрока, команду, тип действия, используемую часть тела и результат. Авторы также выпускают пакет Python, который автоматически преобразует потоки событий в SPADL, который в настоящее время поддерживает потоки событий, предоставляемые Opta, Wyscout и StatsBomb. Язык различает 21 возможный тип действий, включая пасы, удары и захваты, и учитывает до четырех различных частей тела и до шести возможных результатов.

VAEP: система оценки действий игроков

В этом разделе авторы представляют структуру VAEP (Оценка действий путем оценки вероятностей) для оценки действий, совершаемых футболистами. Эта структура используется для вычисления значений объективных действий и преобразования их в рейтинг игрока, который представляет собой общий вклад игрока в атаку и защиту своей команды.

Преобразование вероятностей начисления очков и уступок в значения действий

Авторы объясняют, что большинство действий в футбольном матче выполняются с целью увеличить шанс забить гол или уменьшить шанс пропустить гол. Для оценки эффекта действия авторы предлагают рассчитать, насколько оно изменяет шансы как забить, так и пропустить гол в ближайшем будущем.

Авторы определяют атакующую ценность действия как изменение вероятности того, что команда забьет гол в результате этого действия. Точно так же значение защиты определяется как изменение вероятности того, что команда пропустит гол. Все действия должны быть направлены на снижение вероятности уступки, поэтому отрицание оборонительного значения используется как оборонительное значение действия для команды.

Авторы комбинируют наступательные и защитные значения, чтобы получить общее значение VAEP действия. Полная ценность VAEP действия есть сумма его наступательной и оборонительной ценности. Структура VAEP не зависит от представления, используемого для описания действий, и преобразует субъективную задачу оценки действия в объективную задачу предсказания вероятности будущего события естественным образом.

Преобразование значений действий в рейтинги игроков

Затем авторы описывают, как преобразовать ранее рассчитанные значения действий в рейтинг игрока, который представляет собой общий наступательный и оборонительный вклад игрока в свою команду. Авторы предполагают, что рейтинги игроков могут быть получены для любого заданного периода времени, такого как временное окно в игре, полная игра или полный сезон.

Чтобы вычислить рейтинг игрока, авторы объединяют значения отдельных действий в рейтинг игрока за 90 минут игрового времени, который фиксирует среднюю чистую разницу мячей, приносимую команде игрока за 90 минут. Учитывая временной интервал T и игрока p, рейтинг игрока вычисляется путем суммирования атакующих и защитных значений всех действий, которые игрок выполнил в течение временного интервала T, а затем деления на количество минут, в течение которых игрок играл в течение T.

В дополнение к вычислению рейтинга игрока на основе всех действий, рейтинг игрока также может быть рассчитан по типу действия, что позволяет создать профиль игрока, который может помочь определить различные стили игры. В целом, рейтинги игроков могут рассчитываться по разным параметрам, в зависимости от варианта использования.

Оценка вероятности забить и пропустить

На следующем этапе авторы обсуждают свой метод оценки вероятности того, что команда забьет или пропустит в ближайшем будущем. Они обозначают гол, забитый командой хозяев, как гол (h), а гол, забитый командой гостей, как гол (v). Задача состоит в том, чтобы оценить вероятность забить и пропустить как дома, так и у гостей, исходя из текущего состояния игры. Авторы упрощают задачу, оценивая только вероятности для команды, владеющей мячом в данный момент. Это приводит к двум отдельным задачам бинарной вероятностной классификации с одинаковыми входными данными, но разными метками.

Чтобы оценить вероятности, авторы обучают вероятностный классификатор, используя модели машинного обучения, такие как логистическая регрессия, случайный лес или нейронная сеть. Им требуется, чтобы оценки вероятности были хорошо откалиброваны, и для этой цели они используют CatBoost. Последовательность действий, описывающая всю игру, преобразуется в примеры в формате вектора признаков для каждого состояния игры. Затем авторы вычисляют метки и характеристики для каждого игрового состояния.

Создание этикеток

В этом разделе объясняется, как строятся метки для двух задач бинарной классификации: оценки вероятности забить и пропустить в ближайшем будущем для команды, владеющей мячом после действия. Первая задача заключается в оценке вероятности забитого гола, а вторая — в оценке вероятности пропущенного гола.

Для построения меток игровому состоянию присваивается положительная метка (= 1), если команда, владеющая мячом после действия, забила или пропустила гол в последующих k действиях, и отрицательная метка (= 0) во всех остальных случаях. Здесь k — определяемый пользователем параметр, который показывает, насколько далеко в будущем мы заглянем, чтобы определить эффект действия. В этой статье авторы выбрали k = 10 на основе знаний предметной области и предварительных экспериментов.

Особенности построения

Характеристики строятся для каждого примера. Вместо определения признаков на основе всего игрового состояния учитываются три предыдущих действия. Этот подход имеет такие преимущества, как возможность использования фиксированного количества функций, что необходимо для большинства методов машинного обучения. Кроме того, при рассмотрении небольшого окна основное внимание уделяется наиболее важным аспектам текущего контекста.

В зависимости от представления игры в формате SPADL рассматриваются три категории функций. Во-первых, функции SPADL определяются для каждого из трех действий, включая категориальные и вещественные функции для типа действия, результата, используемой части тела, начальных и конечных координат местоположения и прошедшего времени. Во-вторых, сложные функции объединяют информацию внутри действия и последовательных действий. Для каждого действия включены расстояние и угол до цели как для начального, так и для конечного местоположения, а также пройденное расстояние в обоих направлениях x и y. Между двумя последовательными действиями вычисляются расстояние и прошедшее время, а также меняется ли владение мячом. Эти функции обеспечивают интуитивное представление о текущей скорости игры. Наконец, включены характеристики игрового контекста, такие как количество голов, забитых командой, владеющей мячом, после действия, количество голов, забитых защищающейся командой после действия, и разница мячей. Эти функции включены, чтобы понять, как команды адаптируют свой стиль игры к текущему счету.

Эксперименты

В этом разделе авторы описывают эксперименты, которые они провели для оценки своей структуры VAEP. Они начинают с утверждения, что не существует объективных реальных значений действий или рейтингов игроков, что усложняет оценку. Поэтому они фокусируются на трех основных вопросах:

  1. Обеспечение интуитивных представлений о том, как ведет себя фреймворк и сравнивает его с другими показателями.
  2. Представление вариантов использования, связанных с приобретением и характеристикой игроков
  3. Оценка нескольких дизайнерских решений.

Авторы используют данные Wyscout для высших дивизионов Англии, Испании, Германии, Италии, Франции, Нидерландов и Бельгии и применяют структуру VAEP к 11 565 играм, сыгранным в сезонах с 2012/2013 по 2017/2018 гг., принимая во внимание только матчи лиги и игнорируя товарищеские матчи. , кубок и европейские игры.

Чтобы получить вероятности забитых и пропущенных мячей, ценности действий и рейтинги игроков, авторы обучают две модели классификации, используя алгоритм CatBoost и набор функций, подробно описанных в предыдущем разделе. Они тренируют первую модель в сезонах с 2012/2013 по 2015/2016, чтобы получить результаты в сезоне 2016/2017. Точно так же они обучают вторую модель в сезонах с 2012/2013 по 2016/2017, чтобы получить результаты для сезона 2017/2018.

Интуиция за ценностями действия

В этом разделе авторы дают интуитивное представление о значениях действия, сгенерированных их структурой, путем анализа действий, приведших к голу «Барселоны» в ворота «Реала» 23 декабря 2017 года. Авторы используют рисунок 1, чтобы проиллюстрировать атаку, ведущую к голу, который состоит из шести действий.

Первое действие — пас Серхио Бускетса в сторону правого фланга, которому присваивается значение нейтрального действия 0,00. Второе действие — это пас Лионеля Месси обратно на Бускетса, за который налагается штраф в размере -0,01, поскольку он перемещает мяч назад в менее выгодную позицию. Затем Бускетс делает отличный пас на Месси, который перемещает мяч ближе к воротам и получает ценность действия +0,01.

Затем Месси получает мяч и обводит защитника «Реала» в штрафную, получая значение действия +0,05, что значительно повышает коэффициент результативности с 0,03 до 0,08. Его следующее действие — передача мяча назад и в сторону от переполненной шестиярдовой коробки, которая получает значение действия +0,09 за повышение коэффициента результативности с 0,08 до 0,17. Это действие демонстрирует мощь системы в вознаграждении игроков за перемещение мяча от ворот соперника на основе данных.

Наконец, Алекс Видаль забивает мяч в ворота, получая значение действия +0,83 за преобразование голевого момента 0,17 в гол. Если бы Видаль промахнулся, он был бы оштрафован со значением действия -0,17. Этот пример дает представление о том, как платформа вычисляет значения действий на основе потенциального влияния каждого действия на шансы подсчета очков.

Сравнение рейтингов игроков VAEP с традиционными показателями производительности игроков

В этом разделе авторы сравнивают свои рейтинги игроков VAEP с традиционными показателями эффективности игроков, используемыми в настоящее время, такими как подсчет голов и передач. Чтобы оценить возможности этих метрик, авторы составляют список 10 лучших показателей для сезона английской премьер-лиги 2017/2018 и сравнивают их со списком 10 лучших, составленным их платформой VAEP. Топ-10 игроков с точки зрения количества голов за 90 минут состоит из нападающих, которые сосредоточены на добивании, а топ-10 с точки зрения передач за 90 минут в основном состоят из полузащитников, которые специализируются на создании моментов для своих товарищей по команде. Рейтинг с точки зрения количества голов + передач за 90 минут направлен на достижение баланса между обоими архетипами.

Однако авторы отмечают, что их структура VAEP определяет влиятельных игроков, которые не получают высоких оценок по этим традиционным показателям, таких как Кевин Де Брюйне, Иден Азар и Рияд Марез. Эти игроки считаются звездами Премьер-лиги, но не входят ни в одну из традиционных топ-10. Кроме того, совокупная рыночная стоимость игроков из топ-10 VAEP значительно выше, чем стоимость голов, передач и голов + передачи. Эти наблюдения показывают, что структура VAEP отражает вклад игроков в результаты их команд лучше, чем традиционные показатели эффективности игроков, используемые в настоящее время.

Выявление перспективных молодых игроков и талантов низшей лиги

В этом разделе авторы сосредоточатся на выявлении многообещающих молодых игроков и талантов низшей лиги, используя свою структуру VAEP. Авторы отмечают, что английская и испанская лиги являются самыми сложными и богатыми, что затрудняет получение молодыми игроками игрового времени. Поэтому клубы часто подписывают многообещающих молодых игроков из более мелких лиг, таких как французская, голландская и бельгийская лиги. Авторы исследуют лучшие молодые таланты, сыгравшие не менее 900 минут в сезоне 2017/2018 в английской и испанской лигах отдельно (таблица 2а), а также во французской, голландской и бельгийской лигах (таблица 2б).

Авторы отмечают, что их структура выявляет многообещающие молодые таланты, которые могут быть недооценены традиционными показателями. Например, Джонджо Кенни занимает четвертое место в Таблице 2а, несмотря на то, что его оценочная рыночная стоимость намного ниже, чем у более известных игроков, таких как Маркус Рэшфорд и Усман Дембеле. Авторы объясняют, что Кенни - защитник, которого клубы и болельщики обычно ценят ниже, чем нападающих. Кроме того, он играет за клуб среднего уровня, а это значит, что его окружает меньше игроков мирового уровня. Тем не менее, авторы предполагают, что рейтинги игроков Кенни предполагают гораздо более высокую оценку, чем его текущая предполагаемая рыночная стоимость в 5 миллионов евро.

В таблице 2b авторы отмечают, что Давид Нерес возглавляет рейтинг, за ним следуют Мейсон Маунт и Килиан Мбаппе, получившие награду «Лучший молодой игрок» на чемпионате мира 2018 года. Авторы отмечают, что их структура может служить полезным инструментом для поиска талантов, поскольку она может генерировать рейтинги для каждой лиги в мире при условии, что доступны необходимые данные потока событий.

Характеристика стиля игры

В мире футбола клубы все больше заинтересованы в выявлении игроков, которые лучше всего соответствуют предпочтительному стилю игры их команды, в процессе найма. Однако время разведчиков часто ограничено, что затрудняет рассмотрение всего пула кандидатов на подкрепление. Метрики, которые оценивают способность игрока выполнять различные типы действий, могут помочь выбрать соответствующий набор игроков, заслуживающих дополнительного внимания.

Для решения этой задачи можно использовать структуру VAEP, вычислив рейтинг игрока за 90 минут для каждого типа действия. Например, в тексте сравниваются общие рейтинги за 90 минут для четырех типов действий, когда «Барселона» пытается компенсировать потерю Неймара, приобретая летом 2017 года Усмана Дембеле из «Боруссии Дортмунд» и Филиппе Коутиньо из «Ливерпуля». Согласно метрике, и Дембеле, и Пасы Коутиньо ценятся выше, чем передачи Неймара, а Неймар — превосходный дриблер. Со стилистической точки зрения это говорит о том, что и Дембеле, и Коутиньо были разумными мишенями, поскольку они приличные дриблеры и лучшие распасовщики, чем Неймар.

Точно так же, когда летом 2018 года «Реал Мадрид» потерял своего лучшего бомбардира Криштиану Роналду, борющийся клуб отчаянно нуждался в подходящей замене. Маркус Рэшфорд из «Манчестер Юнайтед» и Эден Азар из «Челси» были связаны с переходом в Мадрид. Тем не менее, ни один из них не приблизился к воспроизведению невероятного завершающего навыка Роналду. Кроме того, у Роналду более высокая общая ценность бросков за 90 минут, чем у Рэшфорда и Азара вместе взятых. В то время как Азар превосходит Рэшфорда во всех аспектах, Рэшфорд был ближе к Роналду с точки зрения стиля, поскольку оба игрока одинаково оценивают передачу и дриблинг. Анализ показывает, что если бы «Реал Мадрид» хотел придерживаться своего нынешнего стиля игры, лучшим выбором был бы 21-летний Рэшфорд. Однако, если их цель состоит в том, чтобы немедленно усилить свою команду, то 28-летний Азар был бы предпочтительным выбором, поскольку он лучший игрок, независимо от его конкретного стиля игры.

Обмен качеством и количеством действий

Далее обсуждается компромисс между качеством и количеством действий футболистов. Авторы отмечают, что большое количество действий может привести к более низкой средней ценности каждого действия. Они используют свою структуру VAEP для построения зависимости среднего количества действий (количества) от среднего значения этих действий (качества) для игроков испанской и английской лиг в сезоне 2017/2018. По сюжету видно, что Лионель Месси выделяется на фоне остальных игроков как качеством действий, так и количеством.

Затем авторы увеличивают масштаб 10 лучших игроков английской премьер-лиги и испанской лиги соответственно. Они выделяют два архетипа: нападающие, которые совершают небольшое количество очень ценных действий, и полузащитники, которые совершают больше менее ценных действий. Филиппе Коутиньо находится между этими двумя архетипами, находя «золотую середину» между качеством и количеством действий. Авторы отмечают, что Гарри Кейн и Мохаммед Салах совершают относительно небольшое количество действий, но в среднем их действия высоко оцениваются. Кевин Де Брюйне и Поль Погба совершают больше действий с меньшей средней ценностью за действие. Наконец, Лионель Месси — исключение, получившее высокие оценки как по качеству, так и по количеству действий одновременно.

Оценка вариантов дизайна

В этом разделе авторы обсуждают проблемы оценки производительности системы обработки данных, особенно в случаях, когда достоверные данные недоступны. Следовательно, вопрос заключается в том, как оценить выбор дизайна, сделанный при создании структуры VAEP. Они отмечают, что в таких случаях нельзя использовать стандартные метрики оценки, такие как точность, воспроизводимость и полнота. В результате единственный способ оценить систему — это оценить компоненты, из которых она состоит.

Чтобы оценить производительность своей системы, авторы обучают модели классификации, используя функции, описанные ранее, с помощью алгоритма CatBoost для создания вероятностей выигрыша и пропуска. Затем они сравнивают эффективность своего подхода с альтернативными подходами, использующими либо другой набор функций, либо другой алгоритм.

Для оценки эффективности каждого подхода авторы используют две метрики, которые часто используются для оценки вероятностных прогнозов: показатель Бриера и ROC AUC. Оценка Брайера измеряет точность и калибровку прогнозов и сводится к минимуму, когда сообщается истинное основное распределение вероятностей данных. Это свойство важно, поскольку предсказанные вероятности суммируются и вычитаются для получения значений действий. Площадь под кривой оператора приемника (ROC AUC) оценивает, насколько хорошо подходы могут отличать положительные примеры от отрицательных. Важным преимуществом ROC AUC является то, что на метрику не влияют несбалансированные наборы данных, так как в их данных только 1,5% (0,5%) всех игровых состояний приводят к забитому (пропущенному) голу.

Авторы также оценивают полезность своего всеобъемлющего набора функций, сравнивая его с четырьмя базовыми наборами функций: нет функций, местоположение, тип действия и местоположение + тип действия. Они оценивают каждый набор функций с помощью алгоритма CatBoost. Для оценки вероятности выигрыша и пропуска их набор функций превосходит базовые наборы функций по обеим метрикам оценки. Этот результат предполагает, что их функции охватывают важный контекст состояния игры, который отсутствует в базовых наборах функций.

Наконец, авторы сравнивают производительность четырех алгоритмов обучения (логистическая регрессия, случайный лес, XGBoost и CatBoost) с использованием разработанных функций. CatBoost работает лучше всех во всех случаях, а XGBoost занимает второе место. Эту узкую победу можно объяснить интеллектуальной обработкой категориальных функций CatBoost по сравнению с более наивным однократным кодированием XGBoost.

В целом методология оценки авторов обеспечивает всесторонний и строгий подход к оценке вариантов дизайна их системы, от выбора функций до выбора алгоритма обучения.

Обсуждение остающихся проблем

Одним из ограничений этой структуры является то, что она оценивает только действия с мячом, в то время как защита также является важным аспектом игры, который не может быть захвачен моделью. Защита часто больше связана с предотвращением захвата мяча противником за счет умного позиционирования и предвидения, которые система VAEP не может оценить.

Еще одна проблема заключается в точном сравнении игроков из разных лиг. Игроки в низших лигах, таких как французская, голландская и бельгийская лиги, могут получить более высокий рейтинг VAEP по сравнению с игроками в более сложных лигах, таких как английская и испанская лиги. Точно так же может быть сложно сравнивать игроков из разных клубов одной лиги, поскольку игроки топ-клубов с сильными товарищами по команде могут совершать более ценные действия, чем игроки клубов среднего звена с более слабыми товарищами по команде.

Авторы также упоминают о проблеме укрепления доверия к рейтингам VAEP среди традиционных скаутов, которые могут быть незнакомы с этим методом оценки футболистов. Рейтинги VAEP могут быть менее интуитивными, чем традиционные показатели, такие как количество голов за 90 минут, из-за чего менее склонным к анализу скаутам может быть сложно понять, что именно измеряют рейтинги VAEP.

В целом, хотя структура VAEP является полезным инструментом для оценки футболистов, у нее есть некоторые ограничения, которые необходимо устранить. Тем не менее, структура VAEP дает ценную информацию о производительности футболистов, и ее полезность можно повысить с помощью дальнейших исследований и разработок.

Связанных с работой

Также представлен обзор смежных работ в области оценки действий игроков в футболе. Авторы отмечают, что эта задача во многом не исследована из-за динамичного и малоголового характера футбола. Однако были предложены некоторые подходы для оценки отдельных действий путем моделирования игры как марковской игры, например, подходы Норстебё и др., Брансена и др., Фернандеса и др. для футбола, Routley и Schulte для хоккея с шайбой и Cervone et al. для баскетбола.

Подход авторов отличается от этих работ тем, что они моделируют точные места каждого действия, а не делят поле на фиксированное количество зон. Их подход также учитывает любые соответствующие действия с мячом во время игры, а не оценивает только ограниченное количество типов действий игроков, таких как передачи и удары.

Авторы отмечают, что большая часть связанной с футболом работы либо фокусируется на ограниченном числе типов действий игроков, либо не учитывает обстоятельства, при которых эти действия происходили. Некоторые подходы решают задачу оценки действий, ведущих к попытке взятия ворот, в то время как другие решают задачу оценки отдельных передач. Однако эти подходы либо наивно приписывают заслуги отдельным действиям, учитывая ограниченный объем контекстуальной информации, либо ограничиваются одним типом действия.

Авторы также упоминают связанную с этим работу над моделями ожидаемых голов, которые оценивают вероятность попытки забить гол. В рамках VAEP авторов вычисление ожидаемой ценности голевой попытки сводится к оценке ценности игрового состояния до голевой попытки. В целом, несмотря на то, что были предложены некоторые подходы к оценке действий игроков в футболе, структура VAEP авторов отличается тем, что моделирует точное местоположение каждого действия и учитывает любые соответствующие действия с мячом во время игры.

Заключение

В этом разделе авторы подводят итоги своей работы и вклада в эту статью. Они представляют SPADL, язык представления данных потока событий, предназначенный для облегчения анализа данных. Они также вводят VAEP, структуру для присвоения значения каждому отдельному действию игрока во время футбольного матча. Авторы подчеркивают преимущества VAEP по сравнению с существующими работами, такие как оценка всех типов действий, оценка на основе игрового контекста и рассмотрение возможных эффектов действия на последующие действия. Авторы объясняют, что VAEP присваивает положительные значения действиям игроков, которые увеличивают шансы команды забить гол, и отрицательные значения тем, которые уменьшают шансы команды забить. В целом авторы предлагают всеобъемлющую основу для оценки действий игроков в футболе, которая учитывает игровой контекст и различные типы действий.

Рекомендации

  • Декрус, Т., Брансен, Л., Ван Хаарен, Дж., и Дэвис, Дж. (2019, июль). Действия говорят громче, чем цели: оценка действий игроков в футболе. В Материалы 25-й международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных (стр. 1851–1861). https://doi.org/10.48550/arXiv.1802.07127

Узнать больше