Фух, пятая неделя не лучшая неделя для моделей. Я так же понял, что игра МИН/ЧИ была урезана из прогнозов. Я включил его сюда, но признаю небольшое несоответствие. На этой неделе я немного подробнее расскажу о двух вещах: точности модели 5 (Ada Boost Classifier) ​​и анализе тенденций сезона. Кроме того, отсутствие точности на этой неделе побудило меня немного больше погрузиться в необработанные данные и соответствующим образом изменить набор обучающих данных. В результате была получена модель с точностью 85 % (подробнее об этом позже).

Для анализа тенденций я рассмотрел 3 тенденции:

  1. Точность модели с течением времени
  2. Процент возврата модели с течением времени
  3. Совокупная доходность модели с течением времени
  4. Точность скользящего среднего значения модели

Я решил сгруппировать каждую модель так, как если бы она использовалась для ставок каждую неделю, поскольку довольно сложно определить, какую модель использовать каждую неделю.

К новой модели. Пытаясь включить в прогнозы больше позиционных данных, я пришел к выводу, что мои тренировочные данные были неполными — ни в одной игре не было неточных данных, но у меня не было данных по каждой игре за последние 10 лет. Это означало, что я не мог объединить данные RB с данными QB, так как часто данные для одного или обоих отсутствовали. Таким образом, я повторно очистил данные QB и RB (что привело к увеличению обучающих данных примерно на 30 %) и повторно запустил конвейер AutoML TPOT, что привело к точности модели случайного леса на 85 %. С помощью этой модели я повторно проанализировал последние 5 недель, чтобы проверить реальные результаты. В интересах прямого сравнения, вот результаты тренда для этой новой модели на 5-й неделе:

Самое интересное в этом то, что, несмотря на то, что коллы имеют точность скользящего среднего всего ~ 56%, масштабирование ставок на основе достоверности делает каждую неделю положительной доходностью, что сильно влияет на доходность сложной модели. Я включу эту модель в прогнозы на 7-ю неделю. Для справки, ее выбор на 6-й неделе выглядит следующим образом: