Вопросы, с которыми я сталкивался в каждом (да, в каждом!) Интервью, которое я когда-либо давал до настоящего времени. Собственно говоря, даже я спрашиваю об этом, когда беру интервью у людей.

Итак, я подумал поделиться со всеми вами и посмотреть, сколько из вас столкнулись с этими вопросами :)

1) Оценочные показатели для логистической регрессии

Это простой вопрос, когда вы упоминаете о точности, но интервьюер обычно формирует сценарий вокруг несбалансированных классов.
В этом случае вам придется поговорить о матрице замешательства и различных связанных с ней статистических характеристиках, таких как чувствительность или отзыв, Специфичность, точность и т. Д. Также полезно упомянуть о Concordance, Discordance и AUC.
https://en.wikipedia.org/wiki/Confusion_matrix

2) Как строится кривая ROC?

Это для того, чтобы узнать, знаете ли вы, кроме AUC! Поговорите об осях X и Y графика и о том, как он построен на основе пороговых значений.
https://www.dataschool.io/roc-curves-and-auc-explained/

3) Случайный лес и его алгоритм

Итак, если у вас есть набор данных из 500 наблюдений и 10 функций, сколько наблюдений выбрано в каждом дереве решений в случайном лесу?
Ответ - все, в данном случае 500. Каждое дерево решений имеет подмножество функций, но содержит все наблюдения.
Хорошо бы прочитать немного о «Случайном лесу», начиная с концепции «Бэггинг».

4) Смещение и отклонение

Правильное понимание смещения и дисперсии и методов уменьшения смещения и дисперсии.

5) Мультиколлинеарность и VIF

Проблемы, связанные с мультиколлинеарностью и формулой для VIF, да формулой (которая является 1/1-Rsquare). Вы должны знать, как рассчитывается этот Rsquare.

Большинство вопросов будет зависеть от вашего опыта и проектов, над которыми вы работали. Тем не менее, я считаю, что это некоторые общие вопросы, которые хорошо позволяют оценить, есть ли у вас знания об алгоритмах или это просто черный ящик для вас.

Так что независимо от того, являетесь ли вы начинающим аналитиком или уже некоторое время работаете в этой области, я надеюсь, что этот пост окажется для вас полезным. Дайте мне знать, если вы тоже столкнулись со всеми этими 5 вопросами :)