Я не эксперт в игре в бадминтон, но после Азиатских игр 2018 года у меня появился новый интерес к наблюдению за турнирами по бадминтону. Ну, я иногда его смотрю, но мне очень интересно знать, кто выиграл, какая страна преуспела, какие очки и так далее.

С 2019 года я работаю над своим проектом по машинному обучению, который заключается в том, чтобы предсказать победителя между двумя игроками. В последнее время я чувствую, что мои навыки создания визуализации данных заржавели, лучше не делать еще хуже. Кроме того, с такой ситуацией во всем мире, которая вынуждает меня работать из дома (и дает мне больше свободного времени), я думаю, что это идеальный момент, чтобы попрактиковаться в моих навыках визуализации данных, используя данные матчей по бадминтону, которые я собрал!

Пролог — несколько заметок перед тем, как мы начнем

В этой визуализации я использую матчи 2010 и 2019 годов. Из всех матчей, произошедших за этот период, я собрал именно эти турниры.

Причина выбора этих турнирных уровней заключается в том, что они более или менее на одном уровне, если вы видите список турниров по уровням/сериям. Кроме того, эти турнирные уровни имели отличные очки для рейтинга игроков. Я решил не брать матчи чемпионата мира, Кубка Томаса и Убера, Кубка Судирмана и Олимпийских игр, потому что я хотел сосредоточиться в первую очередь на турнирах BWF.

Ниже вы найдете аббревиатуру секторов, поэтому вот определения:

  1. MS: мужской сингл
  2. WS: женский сингл
  3. MD: Мужчины, парный разряд
  4. ВД: женщины, парный разряд
  5. XD: смешанный двойной

Это все, что я думаю, я добавлю некоторые заметки позже, если это необходимо.

Люблю всех, играю!

Итак, какие страны чаще всего выигрывали турниры?

На этот вопрос я отвечу, показав годовую тенденцию по секторам. Во-первых, в каждом секторе я собрал топ-6 или топ-8 лучших стран по количеству выигранных турниров. Затем я определяю тренд числа выигранных турниров в каждой стране за год. Серые графики на каждом графике — это тенденции из других стран, входящих в Топ-6/Топ-8 в том же секторе, поэтому будет легче сравнивать тенденции.

Первое, что легко приходит на ум, это Китай доминировал в бадминтоне в последнее десятилетие! Вы можете увидеть общее количество выигранных турниров рядом с названием страны в названии для небольших участков. Корея и Индонезия также всегда входят в число 6/8 лучших в каждом секторе.

В мужском одиночном разряде Китай показал свое превосходство, за ним следует Малайзия. Другим интересным моментом является то, что мы можем видеть крутой подъем Японии в мужском одиночном разряде с 2017 года. За исключением Японии, Китайский Тайбэй склоняется с 2018 года. В женском одиночном разряде в первой половине десятилетия Китай демонстрировал свое доминирование, но позже снизился. Тем не менее, Япония начала расти с 2014 года. Япония взяла на себя долю и выиграла большинство турниров в 2017 и 2018.

Между тем, в мужском парном разряде корейцы доминировали в этом секторе до 2017 года, а его позиции уступила Индонезия, которая с 2014 года продолжала увеличивать количество выигрывал турниры. Такая же ситуация произошла с Китаем и Японией в женском парном разряде. Сначала Китай играл в большинстве турниров, но три пары женских парных турниров Японии изменили ситуацию в 2018 году. Мы также можем видеть, что Корея также начала демонстрировать свои успехи в женском парном разряде в 2018 году. Что касается смешанного парного разряда, Китай снова лидирует в этом секторе, за ним следует Индонезия.

Сколько времени заняли совпадения?

При составлении плана для этих вопросов я сделал некоторые ранние выводы на основе увиденных совпадений. Я думал, женский дубль займет больше всего времени из-за длинных розыгрышей. Посмотрим теперь на распределение продолжительности матча по секторам.

Для лучшего понимания приведенного выше графика точка на каждом графике является медианным значением.

Мы видим, что для женского парного разряда график становится тоньше вправо, но по-прежнему показывает большую толщину для продолжительности от 80 до 100 минут, чем для мужского одиночного. Итак, возможно, моя мысль выше может быть правильной?

На каждом графике после пятен идут очень тонкие горизонтальные линии, обозначающие выбросы. Женский одиночный, женский двойной и мужской одиночный имеют наибольшую продолжительность и становятся исключениями, как видно из графика выше.

Если говорить о самых узких диапазонах продолжительности или самых быстрых матчах, мужские парные и смешанные парные матчи длились от 15 до 75 минут. Если у мужского одиночного разряда самая высокая средняя продолжительность среди всех секторов (40 минут), то у смешанной пары самая короткая средняя продолжительность (35 минут).

Моя вторая мысль: матчи с участием европейских игроков, вероятно, займут больше времени. Причина такого вывода в том, что я видел много матчей с участием европейских игроков:

  1. В прямом эфире два финальных матча с участием мужчин из Дании. Оба они действительно заняли много времени.
  2. В другой раз, когда Кубок Судирмана 2019, я вспомнил, что Индонезия против Дании заняло много времени, чтобы закончиться.
  3. Также в одном из матчей в Индонезии Мастер 2020, когда пара Индонезии была против английской пары, до тех пор, пока это не стало очень резиновым.

Основываясь на этом опыте, я хочу проверить свою гипотезу, сгруппировав продолжительность матча по секторам и континентам, и вот график ниже.

Другие на графике выше означают Океанию и Африку.

Что ж, моя гипотеза верна, когда речь идет о смешанном парном разряде, матчи с участием европейских игроков заняли немного больше времени. В мужском парном разряде, будь то против азиатов или европейцев, потребовалось более или менее одинаковое время, то есть 36 минут. Также мы снова можем заключить, что мужские парные и смешанные парные игры в среднем занимали наименьшее время, независимо от национальности игроков.

Посеянные игроки обычно выигрывали турниры?

Я точно не знаю, что произошло, но мы видим, что в 2014 году сеяные игроки не достигли хороших результатов. Но после этого в каждом секторе тенденция за год стала положительной. Грубо говоря, в среднем было 20 турниров, выигранных посевными игроками каждый год во всех секторах.

Если просто суммировать по секторам, мы можем сказать, что процент турниров с сеяными игроками немного различается в каждом секторе. Посеянные игроки в основном выигрывали турниры с минимум 75%.

Смешанные игроки с двойным посевом выиграли 80% турниров в наборах данных. В мужском парном разряде самый низкий процент сеяных игроков, выигравших турниры. Пожалуй, в целом этот сектор более динамичный и более сложный.

Сколько спичек стали резиновыми (3 сета)?

Опять же, увидев современные тенденции женских парных матчей, я подумал, что в женских парных матчах будет больше всего резиновых спичек. Посмотрим ниже.

На самом деле, факт последнего десятилетия показал, что процент женских парных матчей, переходящих на резину, был самым низким во всем секторе. Кроме того, в одинарных секторах было больше резиновых спичек, чем в двойных. В мужском одиночном разряде ежегодно проводилось около 400 резиновых матчей, а в женском парном разряде было наименьшее количество резиновых матчей в год (около 200).

Это все на данный момент. Я продолжу с другими статистическими данными, которые я смог придумать.

Спасибо Ryan Arifianto Nugroho за помощь и советы по визуализации этого поста.