Набор вопросов для интервью 1

1. Где вы использовали проверку гипотез в своем решении для машинного обучения.

Ответ: я не использовал проверку гипотез, но могу сказать вам, что при проверке гипотез мы в основном формулируем или определяем нулевую гипотезу (H0) и альтернативную гипотезу (H1), которая является напротив утверждения H0, мы проводим эксперимент поверх него, а затем формулируем вывод, должны ли мы принять или отклонить нулевую гипотезу. Например, выиграет ли Индия чемпионат мира в этом году?

2. Какие статистические тесты вы проводили в своем приложении ML?

Ответ: Я еще не проводил статистических тестов, но могу назвать несколько

Z-критерий. Он используется для сравнения средних значений, если они соответствуют нормальному распределению, а также при размере выборки = 30.

Т-тест. Он используется, когда в экспериментах используется небольшой размер выборки (менее 30), и вы не знаете, каково ваше стандартное отклонение. Это хорошо работает при работе с двумя группами

F-тест: также называется Annova Test. Он используется, когда вы хотите сравнить более 2 групп или сравнить 1 числовой и 1 категориальный признак.

3. Что вы понимаете под P-значением? И какая от него польза в ML?

Ответ: Короче говоря, P-значение означает вероятность. Давайте рассмотрим пример в области мыши ноутбука. Какова вероятность того, что вы коснетесь этой конкретной области.

4. Какой тип ошибки является серьезным: ошибка типа 1 или типа 2? И почему с примером.

Ответ: полностью зависит от варианта использования в бизнесе, который будет более серьезным.

Для ошибки типа 1 Предположим, что человек невиновен, если у нас мало доказательств, подтверждающих его невиновность, из-за чего он принимает альтернативную гипотезу (H1). Это не что иное, как ошибка типа 1.

Для ошибки типа 2 давайте рассмотрим вашу нулевую гипотезу (H0): — Рынок рухнет и H1: — Рынок не рухнет, если я не у меня недостаточно доказательств, из-за чего я не смог доказать, что рынок вот-вот рухнет, но у меня было больше доказательств для утверждения H1, поэтому H1 становится верным... но из-за отсутствия доказательств H0 становится правдой. В этом конкретном случае мы получим ошибку типа 2, которая говорит нам, что мы не должны отклонять H1. Мы узнали об этом, увидев Матрицу путаницы, приведенную ниже.

5. Где мы можем использовать хи-квадрат и использовали ли этот тест в любом месте вашего приложения?

Ответ: Когда мы проводим проверку гипотез, мы приходим к выводу для населения на основе выборки набора данных. На основе выборочного набора данных мы разделяем его на альтернативную (H1) и нулевую гипотезу (H0), а затем собираем доказательства, а затем применяем различные методы из который у нас есть критерий хи-квадрат, чтобы выяснить, является ли нулевая гипотеза (H0) истинной или альтернативной гипотезой. Тест хи-квадрат обычно выполняется на категориальных данных. Он также используется для оценки взаимосвязи между двумя или более категориальными переменными.

6. Можем ли мы использовать хи-квадрат с числовым набором данных? Если да, приведите пример. Если нет, укажите причину?

Ответ: Да, критерий хи-квадрат можно использовать для набора числовых данных при условии, что вам нужно сформировать из него отдельные категории на основе частоты числовых данных, которые потребуются.

7. Что вы понимаете под ANOVA Testing?

Ответ: Тест ANOVA становится полезным, когда вы хотите сравнить более 2 групп одновременно. Предположим, что вы хотите рассмотреть 1 числовой признак и 1 категориальный признак, в котором есть больше категорий. Например, ваш числовой признак — Рост, а ваш категориальный признак — Возрастная группа. В возрастной группе вы можете иметь такие категории, как Пожилой, Взрослый, Ребенок. которые являются более чем двумя категориями, тогда мы должны пойти на тестирование ANOVA.

8. Назовите мне сценарий, в котором можно использовать Z-тест и Т-тест?

Ответ: Z-критерий можно использовать, если вам предоставлено стандартное отклонение генеральной совокупности. Он основан на стандартном нормальном распределении. Размер его выборки превышает 30. Например: тестирование среднего балла выборки из 30 учащихся равно среднему значению генеральной совокупности, когда известно среднее значение генеральной совокупности и стандартное отклонение класса, равное 80.

Т-тест используется, когда у вас нет стандартного отклонения населения. Он работает с 1 или 2 числовыми функциями. Обычно он используется, когда размер вашей выборки меньше 30. Например: функция роста и веса.

9. Что вы понимаете под выводной статистикой?

Ответ: Inferential Stats — это то, где на основе размера выборки данных вы проводите эксперименты и предполагаете, что население будет иметь то же самое, что и образец. Например: вы проходили опрос, допустим, как выиграете чемпионат мира. Вы подошли к 30 людям и спросили, как вы думаете, кто выиграет трофей? И по их ответу делаешь вывод, кто победит в матче из населения страны.

10. Когда вы пытаетесь рассчитать стандартное отклонение или дисперсию, почему вы используете N-1 в знаменателе? (Подсказка: Базельское соединение)

Ответ: Поскольку бывают случаи, когда у нас есть искаженные данные, и точки данных выбираются случайным образом, это может быть случай, когда выборка берется, когда точки данных близки друг к другу. Теперь, когда мы берем такую выборку, очевидно, что разница со средним значением генеральной совокупности будет быть очень высоким. Таким образом, чтобы избежать этой разницы, исследователи попытались разделить на n-1, n-2, n-3 и обнаружили, что n-1 заполняет значительную часть пробела от среднего значения выборки.

Набор вопросов для интервью 1

Вопросы по теме