Как найти работу специалиста по данным, часть II
Недавно я прошел собеседование примерно в десяти компаниях на должность специалиста по данным. Я написал статью о том, как найти работу специалиста по обработке данных часть I и часть III, поделился советами по прохождению собеседований и поиску работы. Здесь я хотел бы поделиться некоторыми из наиболее часто задаваемых вопросов во время интервью. Я также добавил некоторые ответы, используя гиперссылки.
Технические вопросы
- Линейная/логистическая регрессия. Сосредоточьтесь на деталях, таких как какое предположение о линейной регрессии? Что такое потерянная функция для логистической регрессии?
- Ридж-регрессия и LASSO. Какая между ними разница? Какими будут весы?
- PCA. Объясните, пожалуйста, как работает PCA? Гиперссылка ведет на pdf-файл из заметок к лекциям Standford CS229 Machine Learning, где подробно описан процесс PCA.
- Перекрестная проверка. Как бы вы использовали перекрестную проверку?
- Смещение и отклонение. Как найти баланс между отклонением и отклонением?
- Методы ансамбля. В чем разница между бэггингом и бустингом? Как работает случайный лес/XGBoost? В каком алгоритме глубина деревьев решений больше и почему?
- К-средних. Объясните, как работает алгоритм К-средних?
- Скорость обучения. Что произойдет, если скорость обучения будет слишком большой/малой?
- Центральная предельная теорема. Как вы понимаете Центральную предельную теорему?
- Ковариация, коэффициент корреляции и R². Какая связь между ними?
- Теорема Байеса. Обычно вам будет задан вопрос о вычислении апостериорной вероятности. Каково уравнение теоремы Байеса и определение априорного, апостериорного?
- Выборка. Имея доступ к универсальному генератору случайных чисел в диапазоне [0, 1], как бы вы сгенерировали выборку из определенного (для простоты абсолютно непрерывного) распределения?
- Проверка гипотез. Академия Хана предлагает отличный видеоряд на эту тему.
- Доверительный интервал. Вы также можете получить сопутствующие знания в Академии Хана.
- Облачные вычисления. Есть ли у вас опыт облачных вычислений? Можете ли вы объяснить облачные вычисления нетехническому персоналу?
- Показатель ошибок. В чем разница между MSE и MAE? Если прогноз — постоянное число, какой выбор лучше для MSE и MAE? Ссылка ведет на блокнот Coursera. Вы можете найти подробный вывод в Metrics_video2_constants_for_MSE_and_MAE.ipynb.
17. Опишите известную вам структуру нейронной сети.
Поведенческие вопросы
- Расскажите о себе/работе/проектном опыте.
- Почему вы хотите работать специалистом по данным?
- Что вы можете привнести в компанию, если у вас появится такая возможность?
- Что мотивирует вас работать в нашей компании?
- Какой принцип нашей компании вам нравится больше всего и почему?
- Почему ты ушел с предыдущей работы? Какая часть вам нравится больше/меньше всего?
- Расскажите мне о своем опыте, когда вы допустили ошибку.
- Был ли у вас опыт, когда вы расходились во мнениях с вашим руководителем/старшим персоналом, и как вы это проходили?
- Вы когда-нибудь работали с кем-то, с кем трудно сотрудничать, и как вы работали с ними?
- Что ты обычно делаешь, когда свободен? Какое у тебя хобби?
- Что бы вы сделали, если бы у вас было достаточно денег?
- Расскажите мне о проекте, который вы когда-либо делали. Если бы у вас была возможность сделать это снова, как бы вы его улучшили?
Комментируйте, если у вас есть интересные вопросы, которые нужно добавить в этот список.