В индустрии высоких технологий все активнее обсуждается разнообразие и необходимость его улучшения. Хотя область науки о данных может быть разнообразной с точки зрения образования, которое она объединяет, она все еще отстает по таким параметрам, как пол и раса. Многие дискуссии сосредоточены на моральном обосновании разнообразия и инклюзивности на рабочем месте, но я хочу уделить немного времени аргументации в пользу того, почему разнообразие имеет решающее значение для построения хорошо функционирующей команды. Позвольте мне попытаться передать это сообщение через мою (и, надеюсь, вашу) страсть к машинному обучению.

Разнообразие в модели машинного обучения

Предположим, вы строите довольно стандартную модель машинного обучения для своей компании, решающую проблему вроде оттока клиентов. Когда вы собираете элементы для включения в свою модель, два основных качества, которые вы должны искать, - это переменные, которые:

  1. Коррелирован с целевой метрикой (да)
  2. Ортогональные (не коррелированные) друг с другом

Конечно, есть и другие важные характеристики, но, вероятно, это две главные. Почему? Потому что первое качество гарантирует, что переменная актуальна, а второе гарантирует, что она становится все более ценной, поскольку она фиксирует информацию, не содержащуюся в других. Добавление сильно коррелированных функций дублирует друг друга. Они просто не предоставляют вашей модели никакой новой информации. Таким образом, если вы будете преследовать только первое качество и игнорировать второе, вы, вероятно, соберете сотни функций, которые создадут модель, столь же мощную, как и простая модель, только с несколькими из этих наиболее важных переменных.

В будущем, когда вам нужно будет построить модель для другой цели (скажем, вероятности ответа на рассылку по электронной почте), тогда ваши исходные сценарии извлечения и создания функций будут не очень полезны. Если эти очень похожие переменные также не связаны с этой новой задачей, возможность повторного использования этого набора функций довольно низкая. Я бы предпочел создать хранилище функций с разнообразными переменными, которые можно было бы использовать для множества будущих задач.

Как специалист по данным, я видел, как этот сценарий разыгрывался множество раз. Кто-то тратит кучу времени на анализ каждой перестановки исторического использования приложения пользователем за последние X недель вместо изучения новых вторичных источников данных (например, данных поддержки клиентов, взаимодействия пользователей и т. Д.). Я обнаружил, что даже в более продвинутых областях, таких как НЛП, включение альтернативных источников данных так же ценно, как и более изящные архитектуры или поиск дополнительных функций, связанных с текстом.

Однако этот принцип ценить разнообразие выходит за рамки единственной модели. Ансамблевые модели лучше, когда они построены из набора некоррелированных входных моделей. Победившие заявки на Kaggle - это те, которые (а) включают ортогональные источники данных, которые изначально не были предоставлены, и (б) объединяют различные архитектуры моделей (например, деревья, NN и т. Д.). Они ценят разнообразие.

Разнообразие в командах

Ладно, при чем тут разнообразие в командах?

Допустим, вы строите команду, а не модель. Для достижения цели вам нужны очень талантливые люди, и вы должны помнить об этих двух характеристиках:

  1. Люди, обладающие навыками, которые связаны с проблемами, которые мы решаем.
  2. Люди, у которых разные навыки друг от друга

Очевидно, что вас волнует первая характеристика, но есть момент, когда вторая важнее. Если вы нанимаете один и тот же профиль человека (то есть одно и то же образование, один и тот же язык программирования, один и тот же опыт и т. Д.) Снова и снова, то каждый новый человек будет обеспечивать меньшую дополнительную ценность. Как кто-то собирается осваивать новые навыки, если его товарищи по команде - просто зеркала самих себя? Как ваша команда будет разрабатывать новые решения, если у всех есть похожие идеи? Возможно, больше всего беспокоит то, как ваша команда сможет решать различные проблемы по мере изменения бизнеса?

Именно эти причины - а также множество научных доказательств - заставляют меня глубоко заботиться о том, чтобы иметь разнообразную команду. В настоящее время я руковожу группой специалистов по данным машинного обучения, и мы гордимся тем, что пытаемся создать коллаж из предыстории и опыта. Успех моей команды зависит от нашей способности решать самые разные задачи инновационными способами, и было бы наивно с моей стороны полагать, что команда идентичных специалистов по данным идеально подходит для этого.

Вместо этого нам повезло, что у нас есть команда, в которой работают люди как с традиционными, так и с необычными знаниями в области науки о данных. У нас есть члены команды со степенью магистра, доктора философии и даже стажера со степенью бакалавра. У нас есть эксперты в области НЛП, компьютерного зрения, онлайн-обучения и моделирования причинно-следственной связи. Некоторые из них отлично умеют устно общаться и учителя, в то время как другие преуспевают в написании технических работ или построении красивых диаграмм. Дело в том, что всегда есть кто-то, у кого можно поучиться.

Тем не менее, всегда есть возможности для улучшения. С технической стороны моя команда чрезмерно привязана к НЛП. Что касается фона, то соотношение полов в моей команде все еще искажено: 70/30 мужчин и женщин, и наши типы личности определенно больше склоняются к интроверсии, чем к экстраверсии. Ключевым началом является признание сильных и слабых сторон разнообразия вашей команды.

Повышение разнообразия вашей команды

Вы должны искренне верить, что разнообразие пойдет на пользу вашей команде, чтобы построить разнообразную организацию. Многие люди могут одобрять разнообразие с моральной точки зрения, но, на мой взгляд, они с гораздо большей вероятностью примут меры, если верят, что разнообразие действительно соответствует их профессиональным интересам или успеху команды. Итак, прежде чем вы начнете читать все тактики улучшения разнообразия, первое, что вам нужно сделать, это поговорить со своей командой и руководством о том, почему это важно для роста бизнеса. Если их не купят, добиться успеха будет сложно.

Тем не менее, вот несколько моих конкретных тактик по увеличению разнообразия в вашей команде. Для ясности, здесь и здесь доступно гораздо больше списков:

  1. Проверьте описание должности на предмет предвзятости. Я настоятельно рекомендую инструмент textio, чтобы понять, как язык, который вы используете в описании должности, найдет отклик у разных людей. Инструмент выделяет конкретные варианты слов, которые демонстрируют предвзятое отношение к определенным группам. В нашем первоначальном посте использовалось словоблудие, которое сильно перекосилось в сторону мужчин, опиралось на множество корпоративных клише и не упоминало нашу ценность разнообразия.
  2. Убедитесь, что ваши интервьюеры разнообразны и используют объективные процессы для уменьшения предвзятости. Я мог бы написать целое сообщение в блоге на эту тему и некоторых более умных людей, таких как Рэйчел Томас уже сделала. Все люди (в том числе и вы) предвзяты по-разному, поэтому вам следует использовать четкую рубрику оценок, которая гарантирует, что решения да / нет будут приниматься на основе того, что сказал кандидат, а не того, как были истолкованы его действия. При подведении итогов дайте возможность людям называть других или самих себя за их предвзятость. Например, у меня был цикл собеседований, когда команда описывала идеальное лидерство, используя полностью мужские местоимения (т.е. у него должен быть 5-летний опыт работы, а его философия управления должна быть…). В то время это казалось незначительным, но такие небольшие действия оправдают ожидания людей в отношении того типа кандидата, которого они ищут. С другой стороны, я недавно признался в начале опроса кандидата, что я, вероятно, был предвзятым, потому что кандидат напоминал меня как по своему профессиональному прошлому (степень в статистике, опыт работы в Google), так и по личному (жил в аналогичной части Сан-Франциско). , любил соревновательные настольные игры). Невероятно сложно избавиться от предвзятости, но вы, по крайней мере, можете осознавать это и устно возражать.
  3. Сторонник разнообразия во внешних презентациях - Миссия видимая - исключительная инициатива, и я лично пообещал не участвовать в чисто мужских панелях.

Кроме того, я настаиваю, чтобы все поездки по набору персонала в кампус включали сотрудников разных рас и полов. Появление на мероприятии по подбору персонала с четырьмя белыми мужчинами - довольно четкое заявление о том, кто работает в вашей компании и кому следует рассмотреть возможность подачи заявления. Людей вдохновляет возможность увидеть себя в шкуре лидеров, и это намного сложнее сделать, если не представлены ваши демографические или образовательные данные. Так что имейте в виду, что тех, кого вы отправляете на конференции и мероприятия по набору персонала, вы, скорее всего, собираетесь привлечь.

4. Будьте честны с самим собой - Будьте честны с тем, как поживаете вы и ваша компания. Ставьте перед собой цели для достижения успеха и не похлопывайте себя по спине только потому, что вы наравне со своими конкурентами. Вы бы не праздновали, если бы у вас все было хорошо по сравнению с конкурентами по таким показателям, как рост числа пользователей или доход, так зачем вам разнообразие? Мне легко отстаивать прогресс своей команды, но, честно говоря, моя команда не представляет чернокожих или латинских корней, и это большой недостаток для нас. Нам еще предстоит продвинуться вперед, и, вероятно, ваша команда тоже.

Если вы менеджер, вы обязаны перед своей командой активно демонстрировать ценность разнообразия своими словами и действиями. Если вы вносите индивидуальный вклад, возложите на свое руководство ответственность за то, насколько разнообразие важно для них и что они делают для развития разнообразной организации. Исследования неоднократно показывали, что открытые и разноплановые команды работают лучше. Если вы хотите быть частью общего успеха своей компании, вы обязаны создать разнообразную и инклюзивную среду.