Огромный мир данных в спорте

Вы когда-нибудь задумывались, как становится известна статистика владения мячом или скорость конкретного игрока? Еще более странным является расстояние, которое игрок преодолевает за матч.

В 2013 году Бундеслига произвела революцию в сборе данных в футболе, используя оптические данные для получения различных полезных сведений, которые мы используем по прошествии 10 лет. На всех стадионах высшей и второй лиги установлено по 6 HD-камер.

Камеры были настроены таким образом, что отображают каждый объект на поле 25 раз в секунду. Это привело к 4 миллионам наборов данных за матч. Для точности распознавания игроков все они были назначены объектом в системе мониторинга оптических данных. На протяжении всего матча за экранами находится группа людей, следящих за исправностью системы.

Система показывает информацию о пройденном расстоянии, статистике владения мячом, сделанных бросках, созданных моментах, наиболее влиятельных игроках, тепловых картах и ​​многом другом. За сезон собрано более 2 миллиардов позиционных данных по более чем 600 матчам. В 2013 году Бундеслига собрала 2 146 866 859 различных точек данных к концу этого сезона. Они только начинали.

Microsoft недавно заключила партнерское соглашение с Ла Лигой, и теперь это одна из самых интересных лиг, за которой стоит наблюдать только из-за идей и визуальных эффектов, отображаемых на протяжении всей игры. Они отображают расстояние передачи, шансы на передачу или даже вероятность того, что кто-то забьет гол, исходя из различных зависимостей. Это живые данные в лучшем виде. Посмотрите матч Ла Лиги в один из этих прекрасных дней и будьте готовы удивиться!

Наука о данных становится все более популярной. Используя pandas в Python, можно использовать веб-скрапинг для создания алгоритма прогнозирования выигрыша. В Интернете доступно огромное количество данных о матчах, и с помощью правильных инструментов эти данные можно превратить в полезную информацию.

В примере Dataquest с использованием веб-скрапинга для просмотра матчей Премьер-лиги за два сезона также пригодился JavaScript. Простая проверка кнопки, чтобы найти тег, лежащий под ней, сэкономила парню массу времени, потому что он смог создать ярлык для поиска URL-ссылок данных предыдущих сезонов. Кроме того, было проще сгруппировать все эти ссылки вместе без написания множества строк кода.

Было действительно интересно увидеть JavaScript и Python в действии. Данные о совпадениях за два сезона создали 1422 строки и 27 столбцов. Конечно, это зависит от данных, которые вы ищете, но это все еще тонна данных. Вот код, если вам интересно посмотреть, как это работает: https://github.com/dataquestio/project-walkthroughs/tree/master/football_matches

Каждый сезон вносятся улучшения в информацию, которую получают болельщики, и команды используют гораздо больше, чтобы попытаться получить преимущество над своими конкурентами. Очевидно, что наука о данных останется в мире футбола.

Если вы хотите узнать, как работу автомобиля Формулы-1 можно сравнить с управлением космическим кораблем НАСА, следите за обновлениями.

Ресурсы: