«Пытайте Данные, они признаются в чем угодно».

В самом деле, а почему бы не спросить его о наиболее вероятном будущем исходе, подвергнув его статистике и машинному обучению.

Прогнозная аналитика — это использование данных, статистических алгоритмов и методов машинного обучения для определения будущих результатов события с определенной оценкой вероятности. к нему, исходя из прошлого (исторических данных). Цель состоит в том, чтобы выйти за рамки знания того, что случилось, и искать ответ на вопрос:

Что произойдет в будущем?

Прогнозная аналитика не является чем-то новым для мира, она существует уже несколько десятилетий, и в последние несколько лет все больше и больше организаций обращаются к прогнозной аналитике, чтобы увеличить свою прибыль и использовать ее для получения конкурентного преимущества на таком огромном рынке. .

Сегодня в результате

  • Растущие объемы и типы данных, а также большее доверие и интерес к использованию данных для получения ценной информации.
  • Быстрее и дешевле компьютеры
  • Усовершенствованное, но простое в использовании программное обеспечение
  • Ситуативный спрос (более жесткие экономические условия и необходимость конкурентной дифференциации)

использование Predictive Analytics стало довольно распространенным явлением среди организаций. Это уже не только работа математиков или статистиков: со всеми доступными инструментами и методами бизнес-аналитики и бизнес-эксперты также используют предиктивную аналитику.

Прогнозная аналитика нашла свое применение во всех возможных отделах организации, будь то

  • Маркетинг
  • Цепочка поставок
  • Операции
  • Финансы
  • Человеческий ресурс и т.д.

В сегодняшнем высококонкурентном мире знания и способность выполнять предиктивную аналитику дают вам преимущество перед другими. Он имеет свое применение во многих областях. Например,

· Оптимизация маркетинговых кампаний:

→ Можно определить поведение клиентов (отклики или покупки), а также продвигать возможности перекрестных продаж. Это помогает бизнесу привлекать, удерживать и развивать своих самых прибыльных клиентов.

· Оптимизация маршрута:

→ Он используется для оптимизации маршрута доставки, топлива и времени, поскольку это сэкономит компании значительную сумму денег.

· Улучшение операций:

→ Многие компании используют прогностические модели для прогнозирования запасов и управления ресурсами.

→ Авиакомпании используют прогнозную аналитику для определения цен на билеты.

→ Отели пытаются предсказать количество гостей на каждую ночь, чтобы максимизировать заполняемость и увеличить доход.

Прогнозная аналитика позволяет организациям работать более эффективно.

· Кадровая аналитика:

→ Анализ лояльности сотрудников / Управление рисками увольнения

→ Прогнозирование кадрового потенциала и потребности в найме

→ Анализ настроений сотрудников

→ Управление рисками мошенничества со стороны сотрудников

→ Профили кандидатов и сотрудников

· Спортивная аналитика

→ Он использует данные, связанные со спортом, такие как статистика игроков, погодные условия, информация от опытных скаутов и т. д., и строит прогностические модели для принятия обоснованных решений, чтобы иметь конкурентное преимущество перед другими.

Как это работает?

Прогнозные модели используют известные результаты для создания моделей (обучения), которые можно использовать для прогнозирования значений других или новых данных. Моделирование (математическое соотношение) обеспечивает выходные данные в виде прогнозов, которые представляют целевую переменную (например, доход) с некоторой вероятностью достоверности, связанной с ней на основе предполагаемого воздействия или значимости набора входных переменных.

Это отличается от описательных моделей, которые помогают вам понять, что произошло, или диагностических моделей, которые помогают вам понять ключевые отношения и определить, почему что-то произошло. У нас есть ряд книг, посвященных только аналитическим методам и приемам. Полная учебная программа колледжа углубляется в этот предмет. Следует понимать, что существует два типа прогнозных моделей.

→ Модели классификации, которые предсказывают принадлежность к классу. Например, вы пытаетесь классифицировать, будет ли клиент покупать или не покупать продукт, покинет ли сотрудник организацию в определенный период времени или нет. Обычно результаты этих моделей имеют форму 0 или 1, где 1 — это событие, на которое вы ориентируетесь.

→ Регрессионные модели предсказывают количество — например, сколько запасов необходимо хранить, сколько единиц продукта будет продано, какой доход клиент получит в следующем году или число месяцев, до которых компонент на машине выйдет из строя.

Теперь давайте поговорим о нескольких наиболее часто используемых методах прогнозного моделирования.

  • Деревья решений. Деревья решений — это модели классификации, которые разбивают данные на подмножества на основе категорий входных переменных. Это поможет вам понять чей-то путь принятия решений. Дерево решений выглядит как дерево, в котором каждая ветвь представляет собой выбор между несколькими альтернативами, а каждый лист представляет собой классификацию или решение. Эта модель просматривает данные и пытается найти одну переменную, которая разбивает данные на самые разные логические группы. Деревья решений популярны, потому что их легко понять и интерпретировать. Они также хорошо обрабатывают пропущенные значения и полезны для предварительного выбора переменных. Итак, если у вас есть много пропущенных значений или вы хотите получить быстрый и легко интерпретируемый ответ, вы можете начать с дерева.
  • Регрессия.Регрессия (линейная и логистическая) — один из самых популярных методов в статистике. Регрессионный анализ оценивает отношения между переменными. Предназначенный для непрерывных данных, которые, как предполагается, следуют нормальному распределению, он находит ключевые закономерности в больших наборах данных и часто используется для определения того, насколько конкретные факторы, такие как цена, влияют на движение актива. С помощью регрессионного анализа мы хотим предсказать число, называемое откликом или переменной Y. При линейной регрессии одна независимая переменная используется для объяснения и/или прогнозирования результата Y. Множественная регрессия использует две или более независимых переменных для прогнозирования результата. С помощью логистической регрессии неизвестные переменные дискретной переменной прогнозируются на основе известного значения других переменных. Переменная ответа является категориальной, то есть может принимать только ограниченное количество значений. При бинарной логистической регрессии переменная отклика имеет только два значения, например 0 или 1. При множественной логистической регрессии переменная отклика может иметь несколько уровней, например низкий, средний и высокий или 1, 2 и 3.
  • Нейронные сети. Это сложные методы, способные моделировать чрезвычайно сложные отношения. Они популярны, потому что они мощные и гибкие. Сила заключается в их способности обрабатывать нелинейные отношения в данных, что становится все более распространенным по мере того, как мы собираем больше данных. Они часто используются для подтверждения результатов простых методов, таких как регрессия и деревья решений. Нейронные сети основаны на распознавании образов и некоторых процессах ИИ, которые графически «моделируют» параметры. Они хорошо работают, когда неизвестна математическая формула, связывающая входные данные с выходными, предсказание важнее объяснения или имеется много обучающих данных. Искусственные нейронные сети изначально были разработаны исследователями, которые пытались имитировать нейрофизиологию человеческого мозга.

Другие популярные методы, о которых вы можете услышать:

  • Байесовский анализ
  • Модели ансамбля
  • Повышение градиента
  • Анализ основных компонентов
  • Машина опорных векторов
  • Интеллектуальный анализ данных временных рядов

Теперь вопрос на миллион долларов. Что необходимо для начала работы с Predictive Analytics?

Шаг 1. Прежде всего, чтобы начать использовать предиктивную аналитику, нужно решить проблему. Что вы хотите знать о будущем, исходя из прошлого? Что вы хотите понять и предсказать? Вы также захотите рассмотреть, что будет сделано с прогнозами. Какие решения будут приниматься на основе этих идей? Какие действия будут предприняты?

Шаг 2. Во-вторых, вам понадобятся данные. В современном мире это означает данные из многих мест. Транзакционные системы, данные, собранные датчиками, сторонняя информация, заметки колл-центра, веб-журналы и т. д. Вам понадобится специалист по обработке данных или кто-то с опытом управления данными, чтобы помочь вам очистить и подготовить данные для анализа. Для подготовки данных для прогнозного моделирования также требуется кто-то, кто понимает как данные, так и бизнес-задачу. То, как вы определяете свою цель, важно для того, как вы можете интерпретировать результат. (Подготовка данных считается одним из наиболее трудоемких аспектов процесса анализа. Так что будьте к этому готовы.)

Шаг 3. После этого начинается прогностическое построение модели. Все более простое в использовании программное обеспечение означает, что больше людей могут создавать аналитические модели. Но вам, скорее всего, все же понадобится какой-нибудь аналитик данных, который поможет вам усовершенствовать ваши модели и найти наилучшую производительность. И тогда вам может понадобиться кто-то из ИТ-специалистов, который поможет развернуть ваши модели. Это означает, что модели должны работать с выбранными вами данными — и вот где вы получите свои результаты.

Шаг 4. Прогнозное моделирование требует коллективного подхода. Вам нужны люди, которые понимают решаемую бизнес-проблему. Кто-то, кто знает, как подготовить данные для анализа. Кто-то, кто может строить и улучшать модели. Кто-то из ИТ-специалистов, чтобы убедиться, что у вас есть правильная аналитическая инфраструктура для построения и развертывания моделей. И исполнительный спонсор может помочь воплотить ваши аналитические надежды в реальность.

Вывод. Я хотел бы подчеркнуть тот факт, что предсказание — это больше искусство, чем наука, потому что, если у вас нет правильной цели, известной вам, вы не сможете стрелять, поэтому это жизненно важно для человек, планирующий выполнить прогнозную аналитику, чтобы сначала найти основную проблему, а затем продолжить процесс.

В ближайшие дни я подробно напишу о некоторых из упомянутых выше аналитических методов. Быть в курсе.