За последний год в моем отделе кадров наши продукты для аналитики персонала смогли применить модели машинного обучения к нашим данным о текучести кадров, чтобы создать прогнозируемую вероятность ухода в процентах (PoL%) для каждого сотрудника. Сам по себе этот показатель остается интересным и показательным для наших сотрудников, отделяя факторы, которые с большей вероятностью будут способствовать текучести кадров, от менее вероятных. Наши модели запускаются ежедневно для прогнозирования PoL% каждого сотрудника, генерируя процентное соотношение, отражающее вероятность того, что они решат покинуть компанию.

Но как только мы туда попали — что мы на самом деле делаем с этой информацией? Например, мы не занимаемся тем, чтобы делиться этими процентами с менеджерами, поскольку они бесполезны без контекста и на них нельзя действовать в одиночку. Если бы мы знали, что увеличение вознаграждения связано с более низкой текучестью кадров (а это так), мы бы не стали менять компенсацию для всех, чтобы снизить их PoL%. На эти проценты, вероятно, слишком остро отреагируют менеджеры, которые особенно обеспокоены тем, что ключевые таланты покидают организацию. PoL% наиболее полезен как математическое представление вероятности текучести кадров по всей компании на основе исторических данных и не особенно полезен для глубокого изучения каждого отдельного сотрудника.

Где эта метрика PoL% сияет, так это в прогнозировании — например, мы знаем, что люди уйдут из организации из-за текучести кадров. Мы понимаем наши тенденции текучести кадров, чтобы знать, сколько людей может уйти каждый год. Откуда мы могли знать, кто эти люди? Используя PoL% для каждого сотрудника и запустив множество симуляций текучести кадров, мы можем создать прогноз того, что эти сотрудники в совокупности значат для организации. Если мы знаем, что около 100 человек уволятся до конца года, мы можем предсказать, насколько велика вероятность того, что отдельные сотрудники окажутся в этой сотне в течение следующего года.

Эти «симуляции», по сути, представляют собой тестовые прогоны того, что может произойти в будущем, — спрашивая наши модели машинного обучения: «если бы вам пришлось выбирать, кто в конечном итоге уйдет в этом году?» Для запуска каждой симуляции мы берем текущий PoL% каждого сотрудника и сравниваем его со случайным событием. Для этого (на основе того, как модели были обучены) мы определили PoL% как вероятность того, что сотрудник покинет компанию в течение следующих 12 месяцев. Для каждого сотрудника создается случайный процент от 0% до 100%. Если случайный процент выше, чем PoL% сотрудника, сотрудник «Остается» в моделировании, а если случайный процент ниже, чем PoL% сотрудника, сотрудник «Уходит» в моделировании.

Исходя из этого, мы оцениваем, какая часть этого оборота произойдет в течение периода времени, на котором сосредоточен анализ. Часто это оставшаяся часть года, поэтому общее количество отпусков, предсказанное моделированием, основано на проценте календарного года, оставшегося от моделирования. Это дает результаты одного моделирования: количество сотрудников, которые уволятся в оставшуюся часть года.

Конечно, единичная симуляция — это случайность, и мы не можем ожидать, что наши модели сделают ее точно правильной. Именно здесь мощь Python особенно пригодится — мы можем просить наши модели делать прогнозы сотни или тысячи раз и суммировать результаты всех объединенных симуляций. Это может привести к красивому (и полезному) распределению сотрудников, покидающих компанию.

Результаты этих симуляций становятся диапазоном возможных результатов, а не одной точкой или событием, к которому мы непосредственно движемся.

Именно этот диапазон результатов лучше всего описывает то, как может выглядеть будущее, и поэтому наиболее полезен при создании моделей компании в будущем. Например, мы можем встроить сценарии «Низкий», «Средний» и «Высокий» оборота в оставшуюся часть года в наш прогноз заработной платы на оставшуюся часть года.

Мы также можем разбить результаты этого распределения на определенные группы внутри организации. Мы можем предоставить руководителю отдела продаж данные об уровне текучести кадров, которые он может увидеть в своей команде, давая ему возможность оценить, насколько большой поток талантов ему необходимо создать, чтобы обеспечить непрерывные продажи. Мы можем заранее предоставить нашим техническим директорам данные о возможной текучести кадров в их различных командах, чтобы заранее знать, где запуск продукта может быть задержан или подвергнут стрессу из-за текучести кадров. Мы можем посмотреть на наших высокопотенциальных сотрудников как на группу и определить, сколько еще нам может понадобиться нанять или обработать внутри, чтобы заменить тех, кто увольняется естественным образом.

Прогнозирование, лежащее в основе этого метода, остается здесь самым мощным методом, который превращает наше прогностическое моделирование в прогнозы, которые гораздо удобнее использовать нашим партнерам и заинтересованным сторонам. Это начало нашей аналитики, которая фокусируется на будущем, представляет собой диапазон возможностей с необходимой неопределенностью — и это может быть наиболее реалистичным способом моделирования нашего мира.