Наивная идея, ориентированная на деньги?

Однажды днем, в середине отпуска, мне пришла в голову мысль об использовании машинного обучения для прогнозирования результатов футбольных матчей в высшей лиге. Сам я никогда не делал ставки на спорт, потому что не люблю распоряжаться деньгами, я так зарабатываю. Однако я поддержал эту идею. Я подумал, что если я смогу разработать алгоритм, который дает мне более 60% точности, я смогу распределить риск и сделать ставку на несколько совпадений, таким образом получая постоянный доход.

Я подумал следующее: если я начну со 100 фунтов стерлингов (я живу в Великобритании) и поставлю 10 фунтов стерлингов на 10 разных матчей, то есть шансы, что я смогу выиграть около 5 из 10 матчей. Если бы у меня был надежный алгоритм, я думал, что смогу заработать огромное состояние. Это важная часть, я никогда в жизни не делал ставок и не знаю деталей и тонкостей индустрии ставок. Я знал, что мне нужно провести исследование, чтобы лучше понять, что мне не хватает.

Я знал, что мне чего-то не хватает; Я не мог быть первым, кто подумал об этом, это никогда не бывает так просто. Я приступил к небольшому исследованию, чтобы лучше понять, что я могу найти по этой теме. Результаты были очень интересными, поскольку я понял, как все работает на самом деле.

Во-первых, я нашел пару журнальных статей, которые позволили мне составить небольшой обзор литературы в этой области. И да, очевидно, это целая область исследований, в которой профессионалы в области искусственного интеллекта посвящают свое время и усилия совершенствованию своих моделей машинного обучения (ML). По данным Bunker et al. (2019) Хотя в нескольких исследованиях рассматривались статистические прогнозы спортивных состязаний, использование парадигмы нейронных сетей является более поздним подходом.

В своем исследовании я нашел процент точности различных алгоритмов для разных видов спорта:

Purucker (1996) достиг 61% точности прогнозов результатов в Национальной футбольной лиге (НФЛ) с использованием модели нейронной сети.

Кан (2003) расширил работу Пурукера (1996), достигнув 75% точности в матчах 14 и 15 недель НФЛ. Для этого были собраны данные о 208 матчах в сезоне 2003 года.

McCabe and Trevathan (2008) изучали прогнозы спортивных состязаний в четырех различных видах спорта, а именно, NFL (регби-лига), AFL (австралийский футбол по правилам), супер-регби (регби-союз) и английская премьер-лига по футболу (EPL), используя данные обратно в 2002 год. Средняя производительность алгоритма NN составила 67,5%.

Давуди и Кхантеймоори (2010) попытались предсказать результаты скачек, используя данные 100 гонок на ипподроме Акведук, проведенных в Нью-Йорке в январе 2010 года. Хотя алгоритм, разработанный Давуди и Кхантеймури (2010), требовал исчерпывающей подготовки время, она достигла точности 77%.

Tax and Joustra (2015) использовали данные соревнований по голландскому футболу для прогнозирования результатов будущих матчей. В этом случае авторы также рассматривали коэффициенты ставок как переменные для своих моделей машинного обучения. В то время как их модели достигли точности 54,7%, модель, в которой использовались только коэффициенты ставок, достигла 55,3% точности. Этот факт заставил меня кое-что понять. У букмекеров есть своя команда по анализу данных. Если шансы на победу команды равны 10/1, то, вероятно, эта команда проиграет.

Узнав, что точность алгоритмов в предыдущем исследовании составляет от 50 до 70% (в зависимости от вида спорта), я все еще думал, что было бы возможно, если бы шансы на матчи были бы как минимум 2/1.

Узнаем, почему с этим еще никто не стал миллионером

Прежде чем написать первую строчку кода, я решил выяснить, действительно ли это возможно. В какой-то момент я подумал, что, возможно, использование собственных алгоритмов незаконно, на что простой поиск в Google ответил, что это разрешено. Затем я подумал о букмекерских конторах и о том, как они регулируют или ограничивают размер ставки. Я нашел диссертацию под названием « Победа над букмекерами с их собственными числами - и как сфальсифицирован рынок онлайн-ставок на спорт 2017».

На этой диссертации мои исследования остановились. В этой статье объясняется, как авторы пытались использовать свой алгоритм для монетизации, и обнаружены два основных препятствия. Первый:

  • Букмекеры используют собственные алгоритмы машинного обучения для определения шансов на матч.

Следовательно, поскольку ваша модель машинного обучения указывает вам на более определенные результаты, вы всегда можете получить низкую выгоду. Во-вторых, что даже более важно:

  • Букмекеры дискриминируют успешных клиентов.

Следовательно, когда вы начнете часто выигрывать, букмекеры начнут дискриминировать вас и ограничивать сумму денег, которую вы можете поставить.

Помимо этих двух препятствий, в статье, которую я обнаружил, поясняется, что за 5-месячный период они сделали 2086 долларов в 672 ставках с доходностью 6,2%. Это хорошо (не очень хорошо с учетом того количества усилий, которые вам нужно вложить), но это тяжелая работа. Вы должны посвятить много времени и усилий, чтобы делать много ставок и выдерживать флажки букмекеров.

Я пришел к выводу, что разработка моделей машинного обучения для ставок на спорт полезна только для практики и улучшения ваших навыков в области анализа данных. Вы можете загрузить созданный код на GitHub и улучшить свое портфолио. Однако я не думаю, что это то, чем вы могли бы заниматься в долгосрочной перспективе как часть своего образа жизни. Потому что в конце букмекеры никогда не проигрывают. В конечном итоге я не выполнил ни одной строчки кода в этом проекте. Я надеюсь, что мой обзор литературы поможет проиллюстрировать других.

Следуй за мной на LinkenIn

Подпишитесь на мою страницу LinkenIn: AI Makers