Мнение

3 лучших алгоритма машинного обучения для включения в ваше резюме по науке о данных

Продемонстрируйте свои навыки стратегически, чтобы привлечь внимание работодателей

Оглавление

  1. Введение
  2. ЛСТМ
  3. XGBoost
  4. CatBoost
  5. Краткое содержание
  6. Рекомендации

Введение

Существует несколько алгоритмов машинного обучения, которые вы можете изучить в академических кругах или использовать на рабочем месте, но некоторые из них могут быть более полезными для практики и применения, чем другие. В конечном итоге это может зависеть от нескольких факторов, таких как проблема, которую вы решаете, имеющиеся у вас данные, ресурсы вашей компании и так далее. Однако я видел несколько алгоритмов, которые кажутся более уникальными, популярными или более точными. Имейте в виду, что эти лучшие алгоритмы сформированы на основе моего мнения и опыта профессионального исследователя данных и интервьюера. Имея это в виду, давайте обсудим причины, по которым вы хотели бы продемонстрировать именно эти алгоритмы машинного обучения.

ЛСТМ

Удивительно, но я не видел, чтобы многие люди вообще включали этот алгоритм, LSTM (длинная кратковременная память), в свое резюме; обычно это один из популярных древовидных алгоритмов и, возможно, модель SARIMA (сезонная авторегрессионная интегрированная скользящая средняя). При этом основная причина включения этого алгоритма машинного обучения в ваше резюме заключается в том, что он уникален и может существенно выделить вас среди других соискателей.

Мало того, этот алгоритм также полезен и может быть очень точным, конечно, в зависимости от других факторов, но возможности действительно кажутся лучше, чем по сравнению с другими подобными алгоритмами. Его также можно использовать для классификации и задач на основе временных рядов, а также он может быть более контролируемым или гибким в своем процессе.

Вот некоторые из преимуществ включения LSTM в ваше резюме:

  • Это уникально
  • Он более сложный, поэтому некоторые люди менее склонны изучать или осваивать этот алгоритм.
  • Это может быть лучше, чем RNN из-за его гибкости.
  • У него есть возможность быть более точным или более мощным в прогнозировании

Как видите, включение и знание этого алгоритма может сделать вас уникальным кандидатом.

XGBoost

Возможно, самый популярный из трех, этот алгоритм является скорее основным алгоритмом для включения в ваш набор инструментов. Этот алгоритм вы должны знать и, конечно же, включить в свое резюме. Поскольку он уже настолько популярен, его преимущество заключается в наличии гораздо большего количества документации.

XGBoot лучше во многих вещах, но если бы вы ранжировали древовидные алгоритмы, я бы сказал, что они идут от деревьев решений → случайный лес → XGBoost, а затем к другому, новому алгоритму, который я привожу ниже.

Вот еще несколько причин, по которым вы должны указать XGBoost в своем резюме:

  • Высокая производительность
  • Часто один из самых точных алгоритмов, поэтому вы можете быть более конкурентоспособными
  • Тонны документации, примеров, так что интервьюеры знакомы с обсуждением этого алгоритма лучше, чем с двумя другими.

Существует бесчисленное множество причин для использования самого алгоритма, но если вы включите его в свое резюме, он покажет, что вы являетесь постоянным кандидатом, обладающим базовыми знаниями, которые можно применить ко многим другим алгоритмам.

CatBoost

Возможно, самым лучшим и новейшим является CatBoost. Примените все, что вы знаете о XGBoost, но добавьте, что он еще быстрее, проще в использовании, точнее и может исключительно хорошо обрабатывать категориальные функции. Он настолько новый, что некоторые интервьюеры могут даже не знать об этом алгоритме, поэтому вы действительно можете похвастаться в своем резюме, когда включите этот алгоритм, но не так далеко, чтобы они не могли его понять, особенно если они знакомы с большинство древовидных алгоритмов и особенно XGBoost.

Чтобы добавить к ранее упомянутому примечанию, теперь мы можем включить окончательный ранг, чтобы включить CatBoost:

Деревья решений → случайный лес → XGBoost → CatBoost

Вот еще несколько причин, по которым вы должны включить CatBoost в свое резюме по науке о данных:

  • Очень новый, и сделает вас более конкурентоспособным кандидатом
  • Можете показать на интервью, что вы можете работать с алгоритмом, который является очень точным и эффективным.
  • Может показать, что вы можете работать с алгоритмом, который хорошо работает с категориальным будущим, почти все алгоритмы так или иначе плохо работают с категориальными функциями, например, с использованием горячего кодирования, которое создает большой разреженный фрейм данных.
  • … Вместо этого вы могли бы сохранить столбец категорийных функций в исходном виде, что упростило бы сотрудничество с заинтересованными сторонами, такими как инженеры-программисты, инженеры по машинному обучению или специалисты по продуктам.

Как видите, я включил самое лучшее напоследок. CatBoost — отличный алгоритм по целому ряду причин, и вы должны включить его в свое резюме.

Краткое содержание

Вы не ошибетесь ни с одним из этих алгоритмов машинного обучения, они очень полезны по разным причинам. Независимо от того, прогнозируете ли вы непрерывную цель, или пытаетесь классифицировать категорию, или даже прогнозируете цель временного ряда, все эти алгоритмы могут помочь получить отличные результаты, и это ценно для вас на собеседовании.

Подводя итог, вот три лучших алгоритма машинного обучения, которые вы должны включить в свое резюме по науке о данных:

* LSTM
* XGBoost
* CatBoost

Надеюсь, моя статья была вам интересна и полезна. Пожалуйста, не стесняйтесь комментировать ниже, если вы согласны или не согласны с этими лучшими алгоритмами машинного обучения. Почему или почему нет? Как вы думаете, какие еще алгоритмы вы включаете в свое резюме по науке о данных? Их, безусловно, можно уточнить еще больше, но я надеюсь, что смог пролить свет на резюме по науке о данных. Спасибо за чтение!

Я не связан ни с одной из этих компаний.

Пожалуйста, не стесняйтесь проверить мой профиль,Matt Przybyla, и другие статьи, а также подписаться на получение уведомлений по электронной почте для моих блогов, перейдя по ссылке ниже, или нажав значок подписки в верхней части экрана рядом со значком подписки, и свяжитесь со мной в LinkedIn, если у вас есть какие-либо вопросы или комментарии.

Ссылка для подписки: https://datascience2.medium.com/subscribe

Рекомендации

[1] Фото Kote Puerto на Unsplash, (2018)

[2] Фото Fakurian Design на Unsplash, (2021)

[3] Фото Johann Siemens на Unsplash, (2014)

[4] Фото Ludemeula Fernandes на Unsplash, (2017)