Наивная идея, ориентированная на деньги?
Однажды днем, в середине отпуска, мне пришла в голову мысль об использовании машинного обучения для прогнозирования результатов футбольных матчей в высшей лиге. Сам я никогда не делал ставки на спорт, потому что не люблю распоряжаться деньгами, я так зарабатываю. Однако я поддержал эту идею. Я подумал, что если я смогу разработать алгоритм, который дает мне более 60% точности, я смогу распределить риск и сделать ставку на несколько совпадений, таким образом получая постоянный доход.
Я подумал следующее: если я начну со 100 фунтов стерлингов (я живу в Великобритании) и поставлю 10 фунтов стерлингов на 10 разных матчей, то есть шансы, что я смогу выиграть около 5 из 10 матчей. Если бы у меня был надежный алгоритм, я думал, что смогу заработать огромное состояние. Это важная часть, я никогда в жизни не делал ставок и не знаю деталей и тонкостей индустрии ставок. Я знал, что мне нужно провести исследование, чтобы лучше понять, что мне не хватает.
Я знал, что мне чего-то не хватает; Я не мог быть первым, кто подумал об этом, это никогда не бывает так просто. Я приступил к небольшому исследованию, чтобы лучше понять, что я могу найти по этой теме. Результаты были очень интересными, поскольку я понял, как все работает на самом деле.
Во-первых, я нашел пару журнальных статей, которые позволили мне составить небольшой обзор литературы в этой области. И да, очевидно, это целая область исследований, в которой профессионалы в области искусственного интеллекта посвящают свое время и усилия совершенствованию своих моделей машинного обучения (ML). По данным Bunker et al. (2019) Хотя в нескольких исследованиях рассматривались статистические прогнозы спортивных состязаний, использование парадигмы нейронных сетей является более поздним подходом.
В своем исследовании я нашел процент точности различных алгоритмов для разных видов спорта:
Purucker (1996) достиг 61% точности прогнозов результатов в Национальной футбольной лиге (НФЛ) с использованием модели нейронной сети.
Кан (2003) расширил работу Пурукера (1996), достигнув 75% точности в матчах 14 и 15 недель НФЛ. Для этого были собраны данные о 208 матчах в сезоне 2003 года.
McCabe and Trevathan (2008) изучали прогнозы спортивных состязаний в четырех различных видах спорта, а именно, NFL (регби-лига), AFL (австралийский футбол по правилам), супер-регби (регби-союз) и английская премьер-лига по футболу (EPL), используя данные обратно в 2002 год. Средняя производительность алгоритма NN составила 67,5%.
Давуди и Кхантеймоори (2010) попытались предсказать результаты скачек, используя данные 100 гонок на ипподроме Акведук, проведенных в Нью-Йорке в январе 2010 года. Хотя алгоритм, разработанный Давуди и Кхантеймури (2010), требовал исчерпывающей подготовки время, она достигла точности 77%.
Tax and Joustra (2015) использовали данные соревнований по голландскому футболу для прогнозирования результатов будущих матчей. В этом случае авторы также рассматривали коэффициенты ставок как переменные для своих моделей машинного обучения. В то время как их модели достигли точности 54,7%, модель, в которой использовались только коэффициенты ставок, достигла 55,3% точности. Этот факт заставил меня кое-что понять. У букмекеров есть своя команда по анализу данных. Если шансы на победу команды равны 10/1, то, вероятно, эта команда проиграет.
Узнав, что точность алгоритмов в предыдущем исследовании составляет от 50 до 70% (в зависимости от вида спорта), я все еще думал, что было бы возможно, если бы шансы на матчи были бы как минимум 2/1.
Узнаем, почему с этим еще никто не стал миллионером
Прежде чем написать первую строчку кода, я решил выяснить, действительно ли это возможно. В какой-то момент я подумал, что, возможно, использование собственных алгоритмов незаконно, на что простой поиск в Google ответил, что это разрешено. Затем я подумал о букмекерских конторах и о том, как они регулируют или ограничивают размер ставки. Я нашел диссертацию под названием « Победа над букмекерами с их собственными числами - и как сфальсифицирован рынок онлайн-ставок на спорт 2017».
На этой диссертации мои исследования остановились. В этой статье объясняется, как авторы пытались использовать свой алгоритм для монетизации, и обнаружены два основных препятствия. Первый:
- Букмекеры используют собственные алгоритмы машинного обучения для определения шансов на матч.
Следовательно, поскольку ваша модель машинного обучения указывает вам на более определенные результаты, вы всегда можете получить низкую выгоду. Во-вторых, что даже более важно:
- Букмекеры дискриминируют успешных клиентов.
Следовательно, когда вы начнете часто выигрывать, букмекеры начнут дискриминировать вас и ограничивать сумму денег, которую вы можете поставить.
Помимо этих двух препятствий, в статье, которую я обнаружил, поясняется, что за 5-месячный период они сделали 2086 долларов в 672 ставках с доходностью 6,2%. Это хорошо (не очень хорошо с учетом того количества усилий, которые вам нужно вложить), но это тяжелая работа. Вы должны посвятить много времени и усилий, чтобы делать много ставок и выдерживать флажки букмекеров.
Я пришел к выводу, что разработка моделей машинного обучения для ставок на спорт полезна только для практики и улучшения ваших навыков в области анализа данных. Вы можете загрузить созданный код на GitHub и улучшить свое портфолио. Однако я не думаю, что это то, чем вы могли бы заниматься в долгосрочной перспективе как часть своего образа жизни. Потому что в конце букмекеры никогда не проигрывают. В конечном итоге я не выполнил ни одной строчки кода в этом проекте. Я надеюсь, что мой обзор литературы поможет проиллюстрировать других.
Следуй за мной на LinkenIn
Подпишитесь на мою страницу LinkenIn: AI Makers