Соавторы: Кларенс Нг (GovTech), Элизабет Лим (GovTech), Тай Минфан (GovTech)

Поиск работы может быть утомительным. Процесс поиска работы включает в себя просмотр сотен вариантов, отслеживание множества заявлений и собеседований, а также управление стрессом и тревогой, которые возникают при поиске подходящей работы. Все было бы намного проще, если бы мы только точно знали, где искать.

Если вы когда-либо чувствовали разочарование в процессе поиска работы, вы не одиноки. На макроуровне Straits Times сообщила, что около 88 600 жителей были безработными в мае 2021 года, при уровне безработицы среди жителей Сингапура 3,8%. Задержки с трудоустройством приводят к потере дохода и могут вызвать стресс и тревогу у лиц, ищущих работу. Задержки с наймом затрагивают и работодателей, поскольку важная работа задерживается из-за нехватки квалифицированной рабочей силы. А для правительств было бы идеально свести к минимуму безработицу, чтобы обеспечить здоровую экономику.

Область теории поиска может быть применена к рынкам труда, а термин трения при поиске работы используется для описания препятствий, с которыми соискатели сталкиваются при поиске подходящей работы. Примеры таких трений включают утомительный процесс поиска в списках вакансий и неуверенность в том, подходит ли предложение о работе. В результате трений при поиске работы соискателям может потребоваться больше времени, чем ожидалось, для поиска работы (фрикционная безработица) или в конечном итоге они соглашаются на работу, которая может им не подходить (неполная занятость).

Когда мы рассматриваем эту проблему, мы задаемся вопросом, могут ли помочь методы науки о данных. Проблемы с поиском и согласованием не являются уникальными для процесса поиска работы. В частности, рекомендательные системы, разработанные сегодня в частном секторе, очень эффективны в подборе людей с соответствующими товарами и контентом, помогая сделать процесс потребления их продуктов максимально беспроблемным.

JumpStart – это платформа, которую мы в DSAID создаем, чтобы уменьшить трудности при поиске работы с помощью науки о данных. Мы считаем, что есть возможности для применения передовых технологий в науке о данных, особенно в рекомендательных системах, для улучшения процесса поиска работы. Платформа JumpStart получает наборы данных со всего правительства для построения моделей обработки данных, а затем развертывает их в виде микросервисов машинного обучения, которые продукты могут использовать для улучшения поиска работы.

В этой серии сообщений в блогах мы рассказываем о проделанной работе, а также о некоторых интересных технических задачах, которые мы решили и над которыми продолжаем думать. В этом первом посте будет рассказано о концепции и подходе к продукту высокого уровня, а последующие посты в блоге более подробно расскажут о науке о данных и инженерных аспектах.

Машина (обучение) важнее человека?

Наука о данных — это не серебряная пуля — нет никакой гарантии, что мы сможем улучшить процессы только за счет «науки о данных». Как и во всех проектах по науке о данных, мы сочли полезным пойти на один уровень глубже, чтобы выяснить, какие части процесса поиска работы мы надеемся улучшить и как мы могли бы это сделать. так. Основываясь на наших исследованиях, мы определили две ключевые болевые точки, для которых, по нашему мнению, наука о данных потенциально может изменить правила игры.

Во-первых, это проблема затрат на поиск. Одним из важных компонентов затрат на поиск является время и усилия, потраченные на просмотр объявлений о вакансиях, изучение длинных описаний вакансий и обдумывание того, подходит ли вакансия. Это может быть утомительным и утомительным занятием. Портал MyCareersFuture, например, содержит более 72 000 открытых объявлений о вакансиях в определенный день (на момент написания), и каждый поисковый запрос может возвращать более 1000 объявлений о вакансиях. На практике из-за утомительного характера ручного поиска работы соискатели рассматривают только подмножество доступных вариантов, что влияет на оптимальность их конечных решений.

Займитесь наукой о данных. В то время как ручная оценка человеком каждого объявления о вакансии занимает в среднем несколько минут, рекомендательные системы могут анализировать все доступные объявления о вакансиях и определять наиболее перспективные вакансии для нас, все в пределах секунды. Это можно сделать, используя широкий спектр сигналов, которые соискатели подают о своих навыках и предпочтениях. Сигналы могут быть явными или неявными. Явные сигналы относятся к источникам данных, таким как резюме и профили навыков, которые соискатели намеренно предоставляют для повышения качества получаемых ими рекомендаций. Неявные сигналы относятся к другим источникам данных, которые не были предоставлены с целью выработки рекомендаций, но дают представление о вакансиях, которые могут подойти соискателю. К ним относятся прошлые поисковые запросы, просмотры вакансий, заявления о приеме на работу и их различные сочетания (например, вакансии, рекомендованные, но не просмотренные, вакансии просмотренные, но не предложенные). В совокупности эти источники данных можно использовать для определения вариантов работы, которые лучше соответствуют предпочтениям и навыкам соискателя.

Чтобы было ясно, соискателю все равно придется рассмотреть и решить, продолжать ли работу, рекомендованную ему, но хорошо разработанная модель может значительно сократить время, затрачиваемое на поиск, позволяя ему сосредоточиться на других аспектах процесса, таких как подготовка для интервью.

Второй проблемой является проблема пробелов в информации. Помимо затрат времени и усилий, определение подходящей работы также означает рассмотрение многих факторов, некоторые из которых связаны с информацией, к которой соискатель может не иметь доступа. Например, соискатели могут не осознавать, что они претендуют на работу в отраслях или профессиях, в которых имеется огромный превышение количества соискателей по сравнению с доступными вакансиями. Они также могут обладать передаваемыми навыками, которые ценятся в других смежных секторах или профессиях с хорошими перспективами роста, что позволяет сменить работу после некоторого обучения. Напротив, когда мы создаем рекомендательные системы, мы можем включать наборы данных, которые фиксируют эти факторы, в генерируемых рекомендациях.

Сложив воедино эти моменты, мы видим потенциал для создания рекомендательных систем, которые могли бы улучшить поиск работы, сделав его быстрее (за счет снижения затрат на поиск) и более информированного (за счет сокращения объема информации). пробелы) по сравнению с чисто ручными процессами.

JumpStart: центральная платформа для микрослужб поиска работы

До этого момента мы в основном концентрировались на потенциале моделей науки о данных, которые могут повысить ценность процесса поиска работы. Однако предстоит проделать гораздо больше работы, чтобы интегрировать эти модели в живые производственные системы, где они могут оказать реальное влияние на наших соискателей. Этот процесс непрост — на самом деле, по сообщениям, 9 из 10 проектов по науке о данных никогда не доходят до производства. ("источник")

Кроме того, нам нужно было подумать о том, как реализовать не одну модель науки о данных, а несколько различных типов моделей для поддержки поиска работы. Например, помимо рекомендаций по работе, мы также можем предоставить рекомендации по курсам для тех, кто может существенно выиграть от повышения квалификации (получив доступ к гораздо большему количеству рабочих мест). Кроме того, если есть соискатели, которым требуется дополнительная помощь в поиске работы, мы можем порекомендовать коучинг по карьере, чтобы они получили необходимую помощь как можно раньше. Существует широкий спектр моделей науки о данных, которые мы можем применять на различных этапах процесса, чтобы лучше помочь нашим соискателям.

Поэтому перед командой встала задача разработать решение, позволяющее быстро и надежно создавать несколько моделей обработки данных, чтобы максимизировать отдачу от работы. Далее следует набор соображений по проектированию, лежащих в основе платформы JumpStart, которую мы создали для развертывания моделей обработки данных для поддержки поиска работы.

Централизованная платформа для моделирования и развертывания. Мы быстро поняли, что было бы неэффективно создавать индивидуальные решения для развертывания для каждой отдельной модели обработки данных, которую мы хотели внедрить в производство. Вместо этого мы можем консолидировать усилия и сделать это один раз на центральной платформе, которая затем поддерживает развертывание всех различных моделей, которые нам необходимо развернуть. Со временем мы обнаружили, что это привело ко многим преимуществам:

  • «Больше данных = лучшее машинное обучение». Консолидация данных на центральной платформе позволяет нам использовать больше факторов и сигналов в наших моделях для создания более четких рекомендаций. Мы хотим, чтобы наши специалисты по данным имели доступ к как можно большему количеству данных для своей работы.
  • Идеи и полезные результаты, созданные одной моделью, могут использоваться другими моделями.
  • Инструменты и инфраструктура развертывания моделей могут быть настроены один раз с общей библиотекой функций и утилит, которые специалисты по данным могут использовать для простого развертывания своих моделей. Кроме того, мы также создали вспомогательные функции, такие как конвейеры обнаружения ошибок для исправления ошибок данных, платформу A/B-тестирования для сравнения моделей и инструменты отчетности о производительности, чтобы отслеживать, как работают модели.

Микросервисный подход. В то же время мы избегали попыток создать грандиозную всеобъемлющую систему, которая пытается самостоятельно решить все проблемы с поиском работы. Построение такой системы было бы огромным усилием, требующим опыта за пределами нашей команды в DSAID. Кроме того, он игнорирует уже переполненную экосистему существующих продуктов и решений, которые поддерживают поиск работы и повышение квалификации (порталы вакансий, системы отслеживания кандидатов, составители резюме, платформы онлайн-обучения и т. д.). Вместо того, чтобы копировать уже проделанную работу, мы сочли более целесообразным создавать микросервисы, которые были бы полезны для существующей экосистемы.

Мы можем понять концепцию микросервиса, разбив этот термин на части и обсудив его значение в контексте JumpStart. «Микро-» означает, что JumpStart сам по себе не предоставляет полноценного решения для поиска работы, а работает для этого в тандеме с другими продуктами в экосистеме. Команда сосредоточена в первую очередь на создании мощных моделей машинного обучения, таких как системы рекомендаций по работе / курсу, и не занимается дизайном пользовательского интерфейса, разработкой интерфейса, созданием политик и схем поддержки — это оставлено другим командам, которые имеют гораздо больший опыт в этой области. эти области, чем мы. «-услуга» относится к цели JumpStart сделать внедрение этих моделей машинного обучения настолько эффективным и простым для любого продукта в экосистеме, где это требуется. Платформа JumpStart выполнит всю тяжелую работу по сбору и очистке соответствующих наборов данных, построению моделей машинного обучения, их тестированию и улучшению, а затем их развертыванию, а также обеспечит легкий доступ к результатам через простые API-интерфейсы, с которыми другие продукты могут легко интегрироваться.

Подходя к нашему продукту таким образом, мы заметили некоторые ключевые преимущества:

  • Повторное использование в различных продуктах и ​​доменах. Помимо портала вакансий MyCareersFuture существует множество областей государственной службы, где было бы полезно давать гражданам хорошие рекомендации по трудоустройству. Это могут быть инструменты для карьерных коучей и амбассадоров или целевые eDM для недавно уволенных сотрудников и новых выпускников. В конечном счете, четко определенный и слабо связанный микросервис может иметь расширенный охват, усиливая наше влияние.
  • Интеграция в сложную технологическую экосистему: JumpStart не только существует в переполненном пространстве продуктов рынка труда (как государственных, так и частных), но также должен учитывать, как он вписывается в технологический стек правительства Сингапура и других граждан. -облицовочные услуги. Если бы мы тесно интегрировали JumpStart с каждым из этих продуктов, это привело бы к огромным накладным расходам на координацию. Вместо этого, если стороны соответствуют спецификациям API, разработка может продолжаться независимо и эффективно.
  • Командный опыт и специализация. Разделяя таким образом роли и обязанности с другими продуктами, мы можем специализироваться на моделировании машинного обучения и обработке данных и сосредоточиться на том, чтобы делать это действительно хорошо (само по себе это огромная проблема, но мы видим ценность в расширении границ в этом пространстве).

Заключение

Недавняя волна цифровизации, возможно, создала давление на рынке труда, но она также предоставила нам инструменты и возможности для создания инновационных и эффективных решений. JumpStart продолжает оставаться развивающимся продуктом по мере возникновения временных проблем (например, внезапный спад из-за Covid-19), и мы планируем долгосрочные изменения в ландшафте (например, поощрение повышения квалификации в качестве новой нормы).

В других сообщениях этой серии мы делимся и обсуждаем некоторые проблемы и успехи, которых мы добились, работая над конкретной областью рекомендаций по работе, как с точки зрения науки о данных, так и с точки зрения инженерии.

Мы надеемся, что вам понравилось узнавать о нашей работе, и если у вас есть какие-либо отзывы или предложения, дайте нам знать, что вы думаете! Мы хотели бы услышать от вас.

P.S. В настоящее время наша команда ищет сотрудников на все должности! Если эта работа покажется вам интересной, ознакомьтесь с нашими объявлениями о вакансиях здесь или напишите по адресу рекомендательный@dsaid.gov.sg.