Математика рейтингов Эло

Расчет относительного мастерства игроков в играх с нулевой суммой

Шахматисты оцениваются в зависимости от того, насколько хорошо они выступают против других игроков. Например, действующий чемпион мира по шахматам и его соотечественник норвежец Магнус Карлсен по состоянию на сентябрь 2019 года получил оценку Международной шахматной федерации ФИДЕ (Fédération Internationale des Échecs) на 2876 баллов, что является самым высоким показателем в мире, но на шесть баллов меньше его собственного пикового рейтинга. из 2882 в 2014 году, когда ему было 24 года.

Рейтинговая система, используемая ФИДЕ и почти всеми другими шахматными федерациями, называется рейтинговой системой Эло. Он был введен в 1960 году Федерацией шахмат Соединенных Штатов по предложению венгерско-американского шахматного мастера, чье имя носит с тех пор, Арпад Эло. Система Эло отслеживает относительную результативность игроков в играх с нулевой суммой, таких как шахматы. Исходя из предположений

Производительность ведет себя как случайная величина
Характеристики, соответствующие распределению вероятностей в форме колоколообразной кривой
Средняя производительность игроков меняется медленно

система позволяет отсортировать группу игроков по относительной производительности и, таким образом, делать обоснованные вероятностные предположения об ожидаемых результатах игр и вариациях в производительности игроков с течением времени.

История

До изобретения рейтинговой системы Эло Шахматная федерация США (USCF) использовала систему числовых рейтингов, разработанную Кеннетом Харкнессом, которая отслеживала результаты отдельных игроков с точки зрения побед, поражений и ничьих. Система оценки Харкнесса использовалась с 1950 по 1960 год. Она рассчитывала средний рейтинг соперников игрока на турнире. Если игрок набирает 50%, он получает средний рейтинг соревнований в качестве рейтинга выступления. Если они набрали больше (меньше) 50%, их новый рейтинг был средним по конкурсу плюс (минус) 10 баллов за каждый процентный пункт выше (ниже) 50%.

Арпад Эло

Введите Эмре Арпад Эло (1903–1992). Эло был мастером шахмат и активным участником Шахматной федерации США (USCF) с момента ее основания в 1939 году, когда он по поручению организации в 1950-х годах разработал новую систему рейтинга игроков на основе известных идей из статистики, включая Математическое ожидание, случайные величины и вероятностные распределения. Эло получил физическое образование в Чикагском университете и стал профессором физики в университете Маркетт в Милуоки, где он также восемь раз выигрывал чемпионат штата Висконсин по шахматам.

Учитывая его биографию, USCF в 1959 году попросил Эло улучшить рейтинговую систему Харкнесса, используемую в шахматном сообществе США. В том же году Эло предложил свою новую систему, приспособив свою формулу к существующей рейтинговой системе, чтобы рейтинги игроков не сильно отклонялись от тех, к которым они привыкли. Согласно его новой системе, средний игрок имел рейтинг 1500, сильный игрок шахматного клуба - 2000, а гроссмейстер - 2500 (Chessbase, 2003).

Эло использовал работы Гуда (1955), Дэвида (1959), Травински и Дэвида (1963) и Бульмана и Хубера (1963) в своем предложении, которое было принято USCF в 1960 году и ФИДЕ в 1970 году. Эло позже описал свою работу в книге Рейтинг шахматистов прошлого и настоящего (Elo, 1978), и среди прочего (теперь уже знаменито) заявил, что:

«Процесс оценки игроков можно сравнить с измерением положения пробки, подпрыгивающей вверх и вниз на поверхности волнующейся воды, с помощью дворовой палки, привязанной к веревке, которая раскачивается на ветру». - Арпад Эло

Представление

Ключевой характеристикой рейтинговой системы Эло является то, что результативность не измеряется абсолютно, а скорее определяется на основе побед, поражений и ничьих против других игроков с разными рейтингами. Другими словами, рейтинги игроков зависят как от их результатов, так и от рейтингов их оппонентов.

В частности, разница в рейтинге между двумя игроками определяет оценку ожидаемого результата между ними. Ключевое предположение Эло состоит в том, что результативность каждого игрока в каждой игре является случайной величиной, которая со временем соответствует распределению вероятностей в форме колоколообразной кривой. Другими словами, в системах рейтингов Эло истинные навыки игрока представлены средним значением случайной переменной производительности этого игрока. Для шахмат Эло предложил масштабировать рейтинги таким образом, чтобы разница в 200 рейтинговых баллов означала, что ожидаемый результат более сильного игрока составляет примерно 0,75.

Ожидаемая результативность игрока в рейтинговой системе Эло является функцией его вероятности выигрыша + половины вероятности розыгрыша. Другими словами, ожидаемая оценка 0,75 может означать 75% -ный шанс на победу, 25% -ный шанс проигрыша и 0% -ный шанс на ничью.

Более конкретно, если шахматисты A и B имеют рейтинги Rᴬ и Rᴮ соответственно, ожидаемый результат игроков A и B определяется по формуле:

Когда баллы игрока превышают (не достигают) ожидаемых баллов, система рейтингов Эло предполагает, что рейтинг игрока был слишком низким (высоким) с самого начала, и поэтому его необходимо скорректировать в сторону повышения (понижения).

Распределение

В первоначальном предложении Эло для USCF система предполагала, что ожидаемые результаты игроков соответствуют нормальному распределению. Позже и USCF, и ФИДЕ изменили свои системы, когда выяснилось, что их эмпирические данные предполагают, что результаты в шахматах больше напоминают логистическое распределение (более тяжелые хвосты / более высокая вероятность экстремальных исходов).

К-фактор

Максимально возможная корректировка за игру в рейтинговой системе Эло называется К-фактором. В первоначальном предложении он был установлен на K = 10 для игроков с рейтингом выше 2400, что означает, что рейтинговая система должна (в некотором смысле) не учитывать важность отдельных событий и вместо этого учитывать тенденцию временного ряда, т.е. означают производительность игрока с течением времени. Эмпирические наблюдения показали, что в отличие от предложенного Эло значения K = 10, K = 24 может быть более точным значением (Sonas, 2002). В настоящее время USCF использует трехуровневый K-фактор для игроков ниже 2100, между 2100–2400 и выше 2400 из 32, 24 и 16 соответственно. ФИДЕ использует аналогичные коэффициенты (40, 20 и 10), хотя и с несколько другими правилами.

Уязвимости

Как и все модели, которые предполагают случайную переменную, рейтинговая система Эло уязвима для выборочных пар и нерепрезентативных популяций, которые делают модель неточной. Например, учитывая форму кривой логистического распределения, игрок с более высоким рейтингом, который имеет возможность выбирать, какие игры принимать, может отклонять игры против оппонентов, в которых вероятность проигрыша высока, и вместо этого играть с игроками с более низким рейтингом, ожидаемая производительность которых намного выше. ниже. Аналогичным образом, изолированно, выбор игроков, не являющихся репрезентативными для глобальной популяции шахматистов, будет генерировать рейтинги, не репрезентативные для их ожидаемых результатов по сравнению с игроками из глобальной популяции.

FaceMash

Предшественником социальной сети Facebook был веб-сайт, созданный Марком Цукербергом в 2003 году, который оценивал студенток Гарварда путем сравнения двух фотографий студентов рядом друг с другом и позволял посетителям голосовать за то, кто более привлекателен. Веб-сайт FaceMash использовал систему рейтингов Elo, чтобы определить, какие изображения учащихся следует размещать рядом.

В этом приложении «ожидаемая успеваемость» (Ea) может интерпретироваться как «ожидание того, что ученик A более привлекателен, чем ученик B», а «оценка» (Ra) как «оценка, с которой ученик А был признан более привлекательным, чем студент Б ».

Это эссе является частью серии рассказов на математические темы, опубликованных в еженедельном издании Medium Cantor’s Paradise. Спасибо за чтение!

Математика рейтингов Эло