Приложение для измерения и количественной оценки неосознанной предвзятости в должностных инструкциях с использованием текста и статистического анализа.

«Разнообразие — это коллективная сила любой успешной организации»

Первоначально опубликовано на https://www.h2o.ai 19 июня 2021 года.

Бессознательное предубеждение — это термин, который так или иначе влияет на всех нас. Он определяется как предубеждение или необоснованные суждения в пользу или против одного предмета, лица или группы по сравнению с другим способом, который обычно считается несправедливым.» Один из наиболее Яркие примеры неосознанной предвзятости наблюдаются в процессе найма, принятом компаниями. Часто бюллетени о вакансиях содержат элементы, благоприятствующие определенному полу, расе или группе.

Предвзятые описания должностей ограничивают не только круг кандидатов, но и разнообразие на рабочем месте. Поэтому компаниям необходимо проверять любые предубеждения в должностных инструкциях и устранять их, чтобы создать здоровую и справедливую культуру в организации.

Чем может помочь искусственный интеллект?

Технологии машинного обучения и искусственного интеллекта позволили точно и точно анализировать данные из различных источников. Будь то структурированные или неструктурированные данные, технологии на основе ИИ могут обеспечить превосходные результаты по сравнению с ручной обработкой. Однако также важно иметь в виду, что конечными пользователями этих инструментов не всегда будут люди с опытом разработки программного обеспечения или машинного обучения. Чтобы такие инструменты стали массовыми, крайне важно сделать их более доступными. Следовательно, будет отличной идеей, если эти приложения ИИ будут встроены в платформу, которая позволит бизнес-пользователям напрямую взаимодействовать с данными без особых хлопот и сложностей. Что ж, H2O Wave был создан именно для решения этой проблемы, и следующий пример продемонстрирует это.

Что такое волна H2O?

H2O Wave — это среда разработки Python с открытым исходным кодом, которая позволяет специалистам по обработке и анализу данных, инженерам по машинному обучению и разработчикам программного обеспечения быстро и легко разрабатывать интерактивные приложения искусственного интеллекта в реальном времени со сложной визуализацией. Можно создавать интерактивные и визуальные приложения ИИ только с помощью Python. Навыки HTML, CSS и Javascript не требуются. Приложения Wave изначально работают на Linux, Mac, Windows или любой другой ОС, где поддерживается Python.

С чего начать

Мы только что запустили нашу 14-дневную бесплатную пробную версию H2O AI Hybrid Cloud в начале этой недели. Вы можете получить практический опыт с нашими демонстрационными приложениями Wave и нашей отмеченной наградами платформой машинного обучения H2O Driverless AI. Все предустановлено, поэтому все, что вам нужно, это веб-браузер. Подпишитесь на бесплатную пробную версию здесь. Пожалуйста, используйте свой корпоративный адрес электронной почты для немедленного доступа. Для получения дополнительной информации о бесплатной пробной версии ознакомьтесь с этим сообщением в блоге.

В этой статье мы создадим квантификатор предвзятости при приеме на работу, используя набор инструментов волны H2O, и используем его для анализа описаний должностей на предмет потенциальной предвзятости. Целевая аудитория этого приложения будет включать бизнес-аналитиков, специалистов по данным, персонал отдела кадров.

Квантификатор предвзятости при приеме на работу

Hiring Bias Quantifier использует текстовый и статистический анализ для измерения и количественной оценки неосознанной предвзятости в должностных инструкциях. Это приложение обобщает различные типы анализа, которые измеряют, количественно оценивают и анализируют бессознательные предубеждения, в частности предвзятость по признаку пола в описаниях должностей. Затем он дает несколько ценных выводов, имеющих отношение к пониманию того, насколько предвзята информация о должностных обязанностях. Он также сравнивает его с эталоном.

Давайте теперь посмотрим, как это приложение может помочь нам обнаружить бессознательную предвзятость в наборе данных, содержащем описания вакансий. В этой статье мы будем работать с предварительно обработанной версией набора данных о вакансиях в Лос-Анджелесеот Kaggle, который включает следующие атрибуты:

Наша задача — определить, содержит ли текст в столбцеdescription_text бессознательную предвзятость или нет.

Методология

Этот набор данных сначала загружается в приложение. «Квантификатор предвзятости при приеме на работу» состоит из нескольких алгоритмов и моделей машинного обучения, которые анализируют различные части текста описания вакансии и выполняют анализ на основе выбора слов, структуры текста, тона, тональности и т. д. Приложение затем создает подробный отчет, содержащий несколько идей и выводов, собранных на панели инструментов. Вот некоторые из подробных результатов:

1. Анализ выбора слов в должностных инструкциях

Неосознанная предвзятость в должностных инструкциях по отношению к определенному полу может ограничить пул кандидатов и разнообразие. На рисунке ниже показано, как выбор определенных слов может привести к предвзятости.

Давайте посмотрим на некоторые идеи, представленные приложением:

  • Использование гендерных ключевых слов в описаниях вакансий

Использование гендерно-специфических слов в описании работы может изолировать определенный пол от подачи заявок на определенные вакансии. Было замечено, что более «агрессивные слова, «напористые» или «независимые» обычно отталкивают женщин от обращения к конкретные роли. На графиках ниже показаны ключевые слова для мужчин и женщин, указанные в наборе данных.

  • Распределение мужского и женского начала в описаниях

Анализ показывает, что для текущего набора описаний должностей характер описаний в большей степени ориентирован на мужчин.

  • Чаще используется превосходная степень

В следующем примере показаны некоторые описания вакансий, в которых используются ключевые слова с высокой степенью превосходства, в частности «Мастер» и «Эксперт». Эти ключевые слова имеют сильный мужской оттенок и, следовательно, показывают предпочтение определенного пола.

2. Анализ текстовых структур

Несколько исследований (LinkedIn, Forbes и Glassdoor) показали, что как качество, так и количество соискателей могут существенно зависеть от того, как написано описание работы.

«Хорошо написанное, полное и содержательное описание работы может привести к привлечению на эту должность лучших и самых разных талантов». С другой стороны, описание, в котором отсутствуют важные характеристики (например, оптимальное количество слов, выбор слов, используемый язык, общий тон), может привлечь меньше кандидатов.

Структуру текста должностной инструкции можно анализировать несколькими способами, а именно:

  • Анализ уровня сложности ключевых слов в описаниях вакансий

Поскольку удобочитаемость имеет первостепенное значение, рекомендуется сосредоточиться и поработать над словами, которые людям трудно читать. График ниже показывает высокий уровень использования сложных слов в описаниях различных должностей.

  • Анализ уровня сложности ключевых слов

Точно так же компаниям следует воздерживаться от создания слишком сложных или трудных для чтения описаний должностей. Например, при анализе было обнаружено, что описания вакансий для следующих должностей были наименее читаемыми.

3. Анализ тона/настроения

Анализ тональности — это подраздел Обработки естественного языка (НЛП), который определяет и извлекает мнения из заданного текста. Анализ настроений должностных инструкций может помочь компаниям оценить их тон и общее настроение. Чувства или тон, передаваемые в описании работы, не должны быть слишком негативными или требовательными, что приведет к тому, что меньше людей подадут заявки на работу.

Следует избегать использования предложений и слов, передающих умеренное или сильное негативное настроение. На следующем графике показано распределение негативных настроений в должностных инструкциях.

  • Тон должностных инструкций

Компании должны следить за тем, чтобы тон должностных инструкций не был слишком негативным. Например, следует избегать ключевых слов, содержащих негативные настроения, которые были автоматически выделены ниже.

  • Использование строгих ключевых слов в описании вакансий

Опять же, чрезмерное использование сложных ключевых слов в описании работы также нежелательно. Следует избегать или заменять такие фразы, как «неудачный», «не будет рассматриваться», «обязательно иметь» и т. д. с положительными и ободряющими словами, такими как «приятно иметь», «дополнение» и т. д.

Вывод

Идея описания работы состоит в том, чтобы побудить более широкую группу людей подать заявление. Таким образом, выбор языка и слов в должностных инструкциях играет решающую роль в продвижении разнообразия соискателей. Следовательно, такие факторы, как содержание, тон, язык и формат, могут прямо или косвенно влиять на процесс найма в компании.