Как найти работу специалиста по данным, часть II

Недавно я прошел собеседование примерно в десяти компаниях на должность специалиста по данным. Я написал статью о том, как найти работу специалиста по обработке данных часть I и часть III, поделился советами по прохождению собеседований и поиску работы. Здесь я хотел бы поделиться некоторыми из наиболее часто задаваемых вопросов во время интервью. Я также добавил некоторые ответы, используя гиперссылки.

Технические вопросы

  1. Линейная/логистическая регрессия. Сосредоточьтесь на деталях, таких как какое предположение о линейной регрессии? Что такое потерянная функция для логистической регрессии?
  2. Ридж-регрессия и LASSO. Какая между ними разница? Какими будут весы?
  3. PCA. Объясните, пожалуйста, как работает PCA? Гиперссылка ведет на pdf-файл из заметок к лекциям Standford CS229 Machine Learning, где подробно описан процесс PCA.
  4. Перекрестная проверка. Как бы вы использовали перекрестную проверку?
  5. Смещение и отклонение. Как найти баланс между отклонением и отклонением?
  6. Методы ансамбля. В чем разница между бэггингом и бустингом? Как работает случайный лес/XGBoost? В каком алгоритме глубина деревьев решений больше и почему?
  7. К-средних. Объясните, как работает алгоритм К-средних?
  8. Скорость обучения. Что произойдет, если скорость обучения будет слишком большой/малой?
  9. Центральная предельная теорема. Как вы понимаете Центральную предельную теорему?
  10. Ковариация, коэффициент корреляции и R². Какая связь между ними?
  11. Теорема Байеса. Обычно вам будет задан вопрос о вычислении апостериорной вероятности. Каково уравнение теоремы Байеса и определение априорного, апостериорного?
  12. Выборка. Имея доступ к универсальному генератору случайных чисел в диапазоне [0, 1], как бы вы сгенерировали выборку из определенного (для простоты абсолютно непрерывного) распределения?
  13. Проверка гипотез. Академия Хана предлагает отличный видеоряд на эту тему.
  14. Доверительный интервал. Вы также можете получить сопутствующие знания в Академии Хана.
  15. Облачные вычисления. Есть ли у вас опыт облачных вычислений? Можете ли вы объяснить облачные вычисления нетехническому персоналу?
  16. Показатель ошибок. В чем разница между MSE и MAE? Если прогноз — постоянное число, какой выбор лучше для MSE и MAE? Ссылка ведет на блокнот Coursera. Вы можете найти подробный вывод в Metrics_video2_constants_for_MSE_and_MAE.ipynb.

17. Опишите известную вам структуру нейронной сети.

Поведенческие вопросы

  1. Расскажите о себе/работе/проектном опыте.
  2. Почему вы хотите работать специалистом по данным?
  3. Что вы можете привнести в компанию, если у вас появится такая возможность?
  4. Что мотивирует вас работать в нашей компании?
  5. Какой принцип нашей компании вам нравится больше всего и почему?
  6. Почему ты ушел с предыдущей работы? Какая часть вам нравится больше/меньше всего?
  7. Расскажите мне о своем опыте, когда вы допустили ошибку.
  8. Был ли у вас опыт, когда вы расходились во мнениях с вашим руководителем/старшим персоналом, и как вы это проходили?
  9. Вы когда-нибудь работали с кем-то, с кем трудно сотрудничать, и как вы работали с ними?
  10. Что ты обычно делаешь, когда свободен? Какое у тебя хобби?
  11. Что бы вы сделали, если бы у вас было достаточно денег?
  12. Расскажите мне о проекте, который вы когда-либо делали. Если бы у вас была возможность сделать это снова, как бы вы его улучшили?

Комментируйте, если у вас есть интересные вопросы, которые нужно добавить в этот список.