Часть I: без предубеждений рекомендовать работу

Джек Брэдмиллер-Фельд | Специалист по данным в Handshake

Это первая из серии публикаций о том, как Handshake использует науку о данных и машинное обучение, чтобы помочь более миллиона студентов колледжей найти отличную работу. Это похоже на то, над чем вы хотели бы поработать? Хорошие новости: набираем!

Полное раскрытие: этот пост не о новых передовых технологиях машинного обучения. Моя самая большая обязанность в Handshake - использовать данные для обеспечения приятного, эффективного и персонализированного поиска работы для наших студентов. Какой бы сложной ни была эта задача, она не заслуживает решения, включающего нейронные сети-на-нейронной сети-на-нейронных сетях (пока). Наша команда предпочитает использовать надежные, эффективные и относительно интерпретируемые методы машинного обучения, такие как переменная факторизация матрицы наименьших квадратов и совместная фильтрация.

Системы персонализации и рекомендаций сегодня повсюду. Вы когда-нибудь смотрели фильм на Netflix и чувствовали себя соблазненными предлагаемыми фильмами, которые появляются на экране во время титров? Вы когда-нибудь продолжали слушать Spotify еще долго после того, как закончился ваш плейлист? Скорее всего, вы уже сталкивались с рекомендательными системами, основанными на поведении, возможно, даже на платформе поиска работы, такой как наша. Я дам вам нетехническое объяснение того, как что-то подобное работает в контексте нашего продукта.

  • Допустим, у нас есть студентка по имени Клайра. Она специализируется на информатике и хочет пройти стажировку в качестве инженера-программиста в Калифорнии. Она подписывается на Handshake и просматривает стажировки в Google, GAP и Lucky Brand.

  • Давайте добавим еще одного ученика, мастера интерфейсной разработки Spencer. Он любит ту же работу в Google.

  • И на всякий случай добавим еще одного ученика - Джордана. Она устраивается на те же должности в GAP и Lucky Brand, а также на одну должность в модном стартапе MM.LaFleur из Сан-Франциско.

  • Клаира и Джордан, похоже, имеют схожие интересы в работе. Тогда мы можем предположить, что работа, которую Джордан находит привлекательной, то есть должность в MM.LaFleur может также понравиться Клайре. Будем активно рекомендовать это ей.

Я немного вводил вас в заблуждение, называя каждого студента и работу и рассказывая вам некоторые из их характеристик - на самом деле это не влияет на эти рекомендации по работе. Все, что реально видит алгоритм, показано ниже:

Тот факт, что несколько студентов, как правило, интересуются одним и тем же набором заданий, является достаточной информацией для многих рекомендательных систем, чтобы выяснить сходство между пользователями, которые, в свою очередь, создают персонализированные, «основанные на вашей истории просмотров / покупок / приложений» - рекомендации по стилю, подобные приведенным ниже на странице студента Рекомендуемые для вас новые вакансии:

Этот тип алгоритма чрезвычайно эффективен; в течение месяцев с большой нагрузкой мы видели, что более 50% всех посетителей этой страницы обращались к вакансиям, которые они там нашли.

Возможно, мы даже больше гордимся тем, насколько хорошо эти рекомендации по работе соответствуют нашей миссии: демократизировать возможности и быть лучшим местом для всех студентов, где они могут найти отличную работу, независимо от того, откуда они и кто они знают. Что я имею в виду?

По сути, мы устранили наши предубеждения относительно того, какая работа подходит определенным типам студентов. Не каждый специалист по информатике хочет быть инженером-программистом. Не каждый великий инженер-программист имеет степень в области компьютерных наук. Единственное, что мы здесь принимаем во внимание, - это то, к каким вакансиям каждый студент уже проявил интерес, просматривая или подавая заявки.

Более того, нам нравится думать о наших индивидуальных рекомендациях по работе как о типе непрямого взаимного обучения. Помните Джордана и Клайру из мультфильмов выше? Мы помогли Клайре открыть для себя возможность в стартапе в Сан-Франциско, о которой она, возможно, и не слышала, - все потому, что Джордан «проверил» ее за нее, подав заявку первым. Представьте на секунду, что Джордан из Сан-Франциско и знает все о модных стартапах в этой стране. Клэйра, возможно, не так знакома с ними, как Джордан, но «Рукопожатие» может помочь восполнить этот пробел в знаниях.

Где у нас еще есть возможности для улучшения? Короче говоря, везде, но особенно в охвате. Как и многие рекомендательные системы, наша страдает проблемой «холодного старта». Очень сложно давать персональные рекомендации новым пользователям. Если ученик плохо знаком с рукопожатием и не работал с какой-либо работой, как Спенсер в приведенной выше карикатуре, тогда мы действительно мало что знаем о его желаниях, если только не зададим им правильные вопросы. Возможно, мы расскажем об этом подробнее в одной из следующих публикаций.