«Я представляю себе время, когда мы будем для роботов тем же, чем собаки для людей, и я болею за машины». — Клод Шеннон

Прошли те времена, когда опросы общественного мнения и экзит-поллы пытались предсказать результаты выборов, теперь вы можете спросить машину, и она скажет вам имя победителя! Я попытался предсказать результаты всех выборов в Государственную ассамблею, прошедших в Индии, с помощью инструментов ИИ; 7 из 10 раз я был прав.

Перед этапом прогнозирования мне пришлось собрать данные примерно о 400 выборах в ассамблею штата, которые были проведены в Индии в 29 штатах и ​​​​7 UT на сегодняшний день. Это был утомительный шаг, который сочетал в себе много веб-скрейпинга и ручных усилий в MS Excel. Я мог собрать данные по 25 штатам для своего анализа; кроме Манипура, Мегхалаи, Нагаленда, Трипуры, Дели и Пудучерри. (Были проблемы с данными указанного штата)

Вот снимок того, что я подготовил с помощью Избирательной комиссии Индии и Википедии.

  • Каждый столбец должен говорить сам за себя, за исключением столбца «До», в котором указано, были ли выборы «несвоевременными выборами» или нет.
  • Y — это целевая функция, которую я хочу предсказать, она равна 1, если действующий президент (политическая партия или коалиция, находившаяся у власти на момент выборов) вернулся к власти, 0 — в противном случае. (Y принимает значение 2, если это первые выборы штата)
  • Для простоты столбец Регион принимает значения только Север и Юг.

Из 280 выборов в 25 рассматриваемых штатах действующий президент приходил к власти 143 раза. Когда я сравнил средний доход на душу населения в штатах, где действующий президент приходил к власти чаще, чем в штатах, где действующему президенту было трудно вернуться к власти, это был момент озарения. , была закономерность!

Это штаты, в которых действующий президент чаще всего приходил к власти, их средний доход на душу населения составляет около 100 тысяч:

Это штаты, в которых действующий президент приходил к власти меньше всего раз, их средний доход на душу населения составляет около 160 тыс. (на 60% выше, чем в первой группе):

В целом, в 50% случаев действующий президент возвращается к власти в Индии. Следовательно, в половине случаев случайное предположение должно быть правильным. Сказав это, если машина превосходит эту случайную правильность, у нас есть результат, верно?

Фактически, имея только четыре функции (штат, год выборов, отметка о несвоевременных выборах и регион), я пытался использовать классификатор CatBoost для своих данных (аналогично заданию вопроса моей машине), в 70% случаев мой классификатор (машина) мог правильно предсказать победителя, что намного лучше, чем случайное угадывание!

Что дальше? Этот показатель точности, очевидно, может возрасти до 80–90%, если я включу другие функции, такие как; Кто был у власти на момент выборов? Какими были темпы роста ВВП страны? Кто был у власти в Центре? Каков был уровень грамотности в рассматриваемом штате? Так далее и тому подобное.

Я напишу вторую часть этой статьи, как только включу упомянутые функции. А пока, пожалуйста, хлопайте в ладоши, если вам понравилась статья, это определенно даст мне толчок для дальнейшего взгляда на индийское политическое пространство глазами искусственного интеллекта.

Ссылка на GitHub для Набора данных и Кода.