«Проблемы - это не что иное, как тревожный сигнал для творчества» - Герхард Гшвандтнер

Вступление

В середине карьеры я начал переход от учителя средней школы к специалисту по анализу данных и должен признать, что чем дольше длится поиск, тем более разочаровывающим это кажется. Вместо того, чтобы опуститься на себя и сдаться, я увидел возможность вырасти. Вы пришли не для того, чтобы читать о проблемах с поиском работы, но вы пришли сюда, чтобы прочитать о том, как я использовал науку о данных, чтобы уменьшить эти трудности. Итак, в этой серии статей вы получите квази-высокоуровневое объяснение и пошаговое руководство по проекту портфолио, целью которого является использование генерации текста для написания сопроводительных писем и, возможно, даже вашего резюме.

Во-первых, эта статья представляет собой введение и обоснование создания этой модели. Может, он тоже выпускает пар.

Вторая часть серии включает извлечение желаемых навыков из должностной инструкции. Мы будем использовать POS-теги и фрагменты для повторного определения навыков и фраз, не связанных с навыками, из набора данных. В этой части 2.

В третьей части будут использоваться модели встраивания слов модели BERT (двунаправленные представления кодировщика от трансформаторов) в сочетании с грамматическими шаблонами в предложениях английского языка для извлечения и классификации навыков. Ссылка, чтобы прийти;

Наконец, мы используем эти извлеченные навыки для разработки сопроводительного письма с использованием модели GPT-2, возможно, недавно выпущенной 3 (Генеративный предварительно обученный трансформатор). Ключевым моментом в этой последней части является изменение вложений, чтобы гарантировать создание желаемых навыков в тексте. Ссылка, чтобы прийти;

Оптимизация - один из первых принципов, которым усваивают научные данные. каждая часть науки о данных сводится к эффективности. С моими новоприобретенными знаниями в области науки о данных и моей врожденной склонностью к эффективности, другими словами, к эффективной лени, я хотел убить двух зайцев одним выстрелом.

  1. Первая птица занималась наполнением моего портфолио значимыми, оригинальными и интересными проектами. Я читаю о том, чем портфолио лучше резюме. В этом портфолио должны быть проекты, которые демонстрируют мои лучшие качества: креативность, решение проблем и амбиции. Их нельзя почерпнуть из резюме, но если кто-то, читая ваше сопроводительное письмо или резюме, узнает, что: [A. он был автоматически сгенерирован; Б. имеет контекстное сходство с описанием должности; C. это продукт моих навыков в области обработки данных], значит, он показывает способность предоставить оптимальное решение.
  2. Вторая птица касается времени и планирования / усилий, связанных с поиском работы. Сколько раз вы слышали: «Поиск работы - это как работа на полную ставку?» Представьте, что вы пишете разные сопроводительные письма для каждой вакансии, на которую вы подали заявку; ты должен! Это много написания сопроводительного письма и исследования компании. Кроме того, будучи специалистом в области науки о данных, у вас может быть резюме, в котором основное внимание уделяется анализу данных, инженерии данных, НЛП и т. Д. У вас также должно быть резюме с описанием этих конкретных навыков. Для эффективного поиска работы необходимо много спланировать.

Некоторое время я составлял индивидуальные сопроводительные письма и постоянно обновлял и настраивал множество различных резюме, но безуспешно, чтобы найти работу на полную ставку. Мне удалось пройти стажировку, которая была отличной, и несколько небольших контрактных позиций для работы фрилансером, но никогда не было такой удовлетворительной работы на полную ставку. Возможно, мое резюме не проходило через ATS (Система отслеживания кандидатов), у меня было слишком мало опыта или потому, что оно должно быть удаленным, потому что я застрял на небольшом камне в Карибском бассейне. (Хотя это неплохое место!). Возможно, ну, возможно, у меня было типичное сопроводительное письмо и резюме, в которых не было количественной оценки или выделения конкретных навыков. Как бы то ни было, я хочу это исправить.

Что, если это, вероятно, попадает в серую зону, к вам обращались компании? Мое объяснение этого - k-кратное;). Я не только оптимизирую эту проблему, но в некоторой степени меняю положение дел. В конечном итоге идея состоит в том, чтобы свести к минимуму время, затрачиваемое на тех, кто не протянет руку, чтобы продолжить процесс собеседования. Когда вы получаете «хит» (ответ компании после подачи заявки), теперь у вас есть возможность подробно изучить компанию, чтобы принять решение о согласии на собеседование. Я полагаю, что, пользуясь законом больших чисел, вы добьетесь лучших результатов. Когда вы пишете резюме и сопроводительное письмо для конкретной компании, потраченное вами время имеет свою цену. Стоимость разная для разных людей, но мне нужно время, чтобы заняться двумя вещами, которые мне нравятся больше всего: играть с детьми и изучать / заниматься наукой о данных. Вот к чему все сводится.

Этот проект представляет собой эксперимент по поиску работы и использует модель искусственного интеллекта и несколько статистических концепций, пытаясь сделать поиск работы простым занятием. Посмотрите следующую часть этой серии.

Если вам интересно следить за этой серией статей и многими другими проектами, над которыми я сейчас работаю, подпишитесь на мою рассылку новостей здесь. Вы получите идеи для проектов, учебные пособия и будете в курсе последних новостей в области науки о данных.