Руководство по собеседованию со статистикой. Если средние ссылки запрашивают вход в систему, откройте их в режиме инкогнито. Если я найду что-нибудь новое, я добавлю внизу и сообщу вам, в основном это касается базового и среднего уровня.

Нормальное распределение (распределение по Гауссу) — важность, как среднее = медиана, симметричная колоколообразная кривая и 68,25% всех случаев попадают в пределы +/- одно стандартное отклонение от среднего. 95% всех случаев находятся в пределах +/- двух стандартных отклонений от среднего, а 99% всех случаев находятся в пределах +/- трех стандартных отклонений от среднего. ["связь"]

Правый наклон, левый наклонный график, какое отношение ч/б означает и медиана, ссылка

разница между корреляцией и автокорреляцией и как она влияет на модель.

разница между ковариацией и корреляцией

разница между дисперсией и стандартным отклонением

разница между процентом и процентилем

разница между нормализацией и стандартизацией ссылка

Что такое проклятие размерности и как с ним бороться (можно спросить об основах алгоритма pca) - ссылка

Что такое выбросы и как их обнаружить, что такое межквартильный размах? (блочная диаграмма) ссылка

Типы выборки — случайная, стратифицированная (имп), кластерная и т. д., ссылка.

Матрица путаницы для модели классификации — точность, точность, полнота, мера F1. Что лучше, когда? "связь"

Ошибка типа 1 против ошибки типа 2

Что такое предвзятость и дисперсия и как они влияют на нашу модель

Недостаточная подгонка (высокая дисперсия, низкая дисперсия), чрезмерная подгонка (высокая дисперсия, низкая дисперсия) и как решить эти проблемы ссылка

Каковы предположения линейной регрессии ссылка, ссылка2 (ссылка2, все вопросы хороши)

Гомоскедастический против гетероскедастического

Как рассчитать мультиколлинеарность наподобие ВИФ ссылка

Типы метрик ошибок для регрессионных моделей link MSE, RMSE и т.д., link

Что такое R² по сравнению с скорректированным R² ссылка

как работает градиентный спуск в линейной регрессии ссылка

различия между линейной регрессией и логистической регрессией (ее классификация сложна). "связь"

Какое математическое ожидание ссылка, коллекция бесселя (хитрая) ссылка

Что такое временной ряд, что такое стационарность и как проверить стационарность (kpss, тест adf).

(стационарность — постоянное среднее значение во времени. Постоянная дисперсия во времени. Постоянная автокорреляция во времени.)

Почему мы не можем использовать линейную регрессию для временных рядов.

Что такое стохастический процесс и случайная величина ссылка

Что такое серия Тейлора и что такое расширение e^x — книга Пола Уилмента

Что означает дифференцирование (наклон касательной в этой точке)

— — — — — — — — — -

Немного продвинутый

Что такое регрессия L1, L2 и как она помогает улучшить модель

Что такое кривая AUC ROC

Что такое теорема Байеса, условная вероятность

Как работают деревья решений, коэффициент Джини?

Чем SVM отличается от линейной регрессии?

Кодирование: -

Python — можно ли изменить строку? , set vs tuple , понимание списка , лямбда-функция и т. д.,