Введение

Для многих сервисов максимально сократить отток клиентов обходится дороже, чем привлекать новых клиентов. Это эффективно, потому что это экономически выгодно и увеличивает ценность услуги.

Возможно, невозможно полностью предсказать и предотвратить отток только с помощью машинного обучения, но если вы не знаете причину увеличения оттока, вы можете найти причину. Однако в тех случаях, когда причины оттока неясны, вы можете определить причину увеличения оттока. Это может быть полезное оружие.

Целевой пользователь этой статьи

Эта статья сознательно написана так, чтобы с ней могли справиться даже инженеры и непрограммисты.
Я старался не использовать слишком много терминов по науке о данных.

От автора

Я хочу, чтобы многие люди испытали анализ данных и машинное обучение, поэтому мы собираемся дать вам практический опыт. Я хочу, чтобы вы это увидели.
Я думаю, это поможет вам понять ситуацию своими руками, и это также поможет вам прояснить, чего вы не понимаете и чего вам не хватает в знании.

Инструменты, которые мы будем использовать

ВАРИСТА
https://www.varista.ai/

VARISTA обеспечивает визуализацию данных и машинное обучение, просто загружая данные. Это служба AutoML, и ее можно использовать бесплатно для одного проекта.
Лучше всего то, что пользовательский интерфейс классный.

Подготовка данных

Лучше всего, если вы можете использовать реальные данные, но в этом случае мы будем использовать открытые данные.
Мы используем данные из Telco Customer Churn на Kaggle.
https ://www.kaggle.com/blastchar/telco-customer-churn

Пожалуйста, зарегистрируйтесь на Kaggle и загрузите данные.

Это довольно чистые данные, но фактические данные не такие чистые, как эти.

Описание данных

Первоначально данные были предоставлены IBM.
Каждая строка представляет клиента, а каждый столбец содержит атрибуты клиента.
Набор данных содержит следующую информацию.

  • Клиенты, уволившиеся в прошлом месяце — эта колонка называется «Отток».
  • Услуги, на которые подписался каждый клиент:
    телефон, многоканальная связь, Интернет, онлайн-безопасность и
    онлайн-резервное копирование, защита устройства, техническая поддержка, а также
    потоковая передача телепередач и фильмов и т. д.
  • Информация об учетной записи клиента:
    срок договора, договор, способ оплаты и
    безбумажный счет, ежемесячные платежи и общая сумма сборов.
  • Демографические данные о клиентах:
    пол, возраст, наличие партнера и иждивенцев.

Загрузить данные в VARISTA

Чтобы зарегистрироваться, нажмите здесь. Это бесплатный план для использования.

https://www.varista.ai/

Сначала создайте новый проект в VARISTA и загрузите свои данные.
Это делается в три шага.
Название проекта может быть произвольным. Например, хорошим выбором будет «Прогнозирование оттока».

Загрузите свои данные.
Файл для загрузки — это WA_Fn-UseC_-Telco-Customer-Churn.csv, который вы скачали с Kaggle.

Затем выберите столбец, который вы хотите спрогнозировать.
Автоматически выбирается «Отток». Нажмите OK, чтобы завершить настройку.

Когда анализ данных будет завершен, вы увидите экран, подобный этому, нажмите кнопку «Пуск».

Теперь вы готовы к работе.

Проверка данных

Во-первых, давайте взглянем на содержимое данных.
Выберите «Данные» в меню и нажмите на данные, которые вы только что загрузили.

Нажмите на файл, чтобы просмотреть подробные данные.

Всего данные показывают 7043 строки (количество клиентов) и 21 столбец (функции).

Визуализация данных

Вы можете увидеть распределение данных, нажав Визуализировать на экране данных.

Вы можете быстро визуализировать распределение данных и т. д., чтобы получить представление обо всех данных с высоты птичьего полета.

Выделим некоторые из них.

Отток
Данные показывают, что среди всех клиентов отток составляет 1869 человек.

Контракт
Контракты часто оплачиваются ежемесячно, а с небольшим интервалом - двухлетние и ежегодные платежи.

Срок пребывания

Я рассмотрю это более подробно после построения модели ИИ, так что на этом все, но если вам интересно, взгляните на различные варианты.

Создание моделей ИИ с помощью машинного обучения

Давайте перейдем к делу, но давайте создадим модель ИИ!
Теперь вы находитесь на экране данных, поэтому сначала выберите «Модель ИИ» в меню. Затем нажмите «Создать модель AI».

Затем нажмите кнопку «Пуск» справа.

Затем VARISTA автоматически создаст для вас модель ИИ.

Через некоторое время обучение будет завершено.
Отобразится информация о сгенерированной модели ИИ.
Давайте понемногу рассмотрим ее подробнее.

Производительность модели ИИ, созданной в этом исследовании, выглядит следующим образом.

– Общий процент правильных ответов: 78,1 %.
– Процент респондентов, которые могли предсказать, что отменят подписку: 75,7 %
– Доля респондентов, которые предсказали, что не отменят подписку: 79 %.

Затем давайте посмотрим на результаты прогноза.
Вот как машинное обучение использует некоторые данные для проверки производительности полученной модели ИИ.

VARISTA сохраняет некоторые данные для проверки и автоматически проверяет правильность прогнозов.
Похоже, что результаты предсказывают отток примерно 75% пользователей.

Наконец, давайте взглянем на факторы высокого воздействия.
Объяснение факторов высокого влияния в VARISTA показано на этом рисунке.

В модели искусственного интеллекта, которую мы построили, срок пребывания в должности, по-видимому, оказывает наибольшее влияние на отток.
Во-вторых, ежемесячные платежи также с большей вероятностью приводят к оттоку.
Это правда, что мы иногда забываем об оттоке в случае ежегодных платежей тоже.

Если вы нажмете на значения, вы сможете увидеть их в деталях, так что давайте посмотрим.

Должность
Кажется, что чем выше ценность владения, тем меньше вероятность того, что она будет упразднена.

Контракт
Ежемесячная подписка с большей вероятностью будет отменена.
Возможно, более высокая ставка скидки на годовую подписку в SaaS и других сервисах предназначена для того, чтобы побудить людей подписать годовой контракт с этим в уме.

InternetService
Пользователи оптоволоконных сетей с большей вероятностью уйдут.
Кроме того, с меньшей вероятностью уйдут клиенты, не пользующиеся услугами Интернета.
Пользователи могут быть недовольны своими услугами. оптоволоконный сервис, поэтому вам может потребоваться изучить фактические интервью и информацию, поступающую в ваш колл-центр.

Способ оплаты
Пользователи, использующие электронные платежи, с большей вероятностью уйдут.
Возможно, было бы неплохо установить какую-то политику, чтобы заставить пользователей перейти на автоматические платежи.

Безопасность в Интернете
Пользователи, которые не регистрировались, с большей вероятностью уходили, а клиенты, которые не пользовались интернет-услугами или безопасностью в Интернете, с меньшей вероятностью уходили.
Хотя существует корреляция , невозможно с уверенностью сказать, есть ли причинно-следственная связь, поэтому нам нужно будет на самом деле опросить пользователей, чтобы получить лучшее разрешение информации.

Прогноз

В разделе «Прогнозировать с помощью этой модели» в правом верхнем углу экрана вы можете добавить информацию о будущих пользователях, которые на самом деле не использовали ее для обучения, чтобы прогнозировать вероятность риска оттока.

Загрузите данные в формате CSV или Excel со следующей информацией, и это даст вам % вероятности оттока.

Резюме

В этой статье я использовал VARISTA без написания кода, чтобы проверить, как можно использовать машинное обучение для прогнозирования оттока клиентов.

Это простое обучение, но мы смогли получить точность прогноза около 80%.

Отток клиентов очень сильно влияет на продажи услуг.
Использование машинного обучения потенциально может повысить прибыльность вашего сервиса за счет выявления и решения проблем оттока, которые раньше были незаметны.

Мы также смогли определить факторы, оказывающие сильное влияние на отток клиентов, и определить приоритетность факторов, требующих дальнейшего изучения.

Однако это только суждение, основанное на имеющихся данных, поэтому на практике вам нужно будет учитывать характеристики службы, с которой вы работаете, и, если отсутствуют данные, вам нужно будет добавить к ним и обновить данные по мере необходимости. нужный.

Мы надеемся, что эта статья дала вам краткий опыт того, что вы можете сделать с помощью машинного обучения, и что она оказалась полезной для ваших услуг.