Вы когда-нибудь создавали личность, основанную на вашем чистом воображении, и впоследствии запускали спираль сомнений и синдрома самозванца в отношении выбранной вами дизайнерской карьеры? Что я делаю? Это надежно в использовании? Я просто мошенник? Поэтому люди не воспринимают дизайн всерьез? Мы здесь просто заводим воображаемых друзей?

Поэтому я подумал про себя, как мы могли бы создать более строгую личность?

Что, если мы сможем создавать персонажей на основе данных, чтобы увеличить поведенческие показатели, такие как отток и личные предпочтения, обеспечить более целенаправленное A/B-тестирование для любой новой функции, которую мы хотим, и служить промежуточным шагом к любому алгоритму прогнозирования?

Проще говоря, как насчет человека, созданного машиной? Разве это не лучше, чем созданная вручную личность, основанная почти ни на чем?

Итак, сегодня мы собираемся создать персону с помощью простого алгоритма машинного обучения с небольшим количеством маркетинга баз данных.

Начнем с того, что классическое машинное обучение = ваш хлеб с маслом для ИИ. Забудьте обо всем этом сексуальном бизнесе с нейронными сетями. Это все, что вам нужно для сегодняшнего упражнения.

Во многих случаях классическое машинное обучение — это все, что вам нужно. Разработка функций и настройка гиперпараметров дают вам больший контроль над всем, вместо того, чтобы работать с черным ящиком. Вам часто приходится представлять свои выводы государственным органам или высшему руководству; классическое машинное обучение создает уравнение для обоснования любого принятого вами решения. Вы можете математически продемонстрировать эффективность модели.

Один из методов машинного обучения называется кластеризацией. Есть два вида.

Иерархическая кластеризация

Медленно, но вам не нужно засеивать центроиды

K-центроидная кластеризация

Быстро, но нужно подобрать начальные номера кластеров. Известный пример: k-средних. Мы собираемся посмотреть на это сегодня.

Шаг 1: среда Python 3.7

Шаг 2. Установите ноутбук Jupyter.

Шаг 3: Установите библиотеки Python

1. Pandas (манипулирование кадрами данных)

2. Sklearn (k-средние и предварительная обработка данных)

3. Matplotlib/seaborn (визуализация данных)

Шаг 4. Выполните RFM-анализ до K-средних

  1. Давность (насколько недавно), частота (как часто), денежный (сколько)
  2. Используйте pandas qcut для получения квартилей для каждой метрики
  3. Сортируйте клиентов по метрике и применяйте метки квартилей
  4. Посмотрите, какой сегмент клиентов является вашим золотым гусем
  5. Объедините эти данные с географическими и демографическими данными, а также данными о поведенческих характеристиках.
  6. Затем примените кластеризацию к сегментам RFM золотого гуся.

Предположения о данных K-средних

Переменные должны быть числовыми, с нормальным распределением, средними значениями и дисперсией.

Шаг 5: Стандартизируйте данные

Шаг 6: Определите оптимальное количество кластеров с помощью «метода локтя».

Шаг 7: Подгонка модели к образцам

Познакомьтесь со своим новым персонажем после машинного обучения.

Гарольд (изображение необязательно)

Оценка RFM: 444 (САМЫЙ ВЫСОКИЙ) Самый золотой из золотых гусей

Демографические данные/Местоположение: 45 лет, живет в Мидленде, штат Техас, высшее образование, женат, работает в нефтяной отрасли 20 лет, годовой доход 100 тысяч, работает в компании три года.

Психометрия/предпочтения: очень заинтересован в офлайн-приложениях, приложениях для проверки, уступчивости, высокой добросовестности, низкой открытости, высокой уступчивости, высокой тревожности.

Возможные следующие шаги

1. A/B-тестирование кластеров золотых гусей на предмет предпочтений дизайна

2. Изучите закономерности низкоэффективных сегментов RFM

3. Предиктивное поведенческое моделирование