Изучать науку о данных легко, но подготовка к собеседованию — непростая работа. Во время интервью по науке о данных интервьюер задаст вам множество вопросов, вопросов, которых вы никогда не ожидали.

Если вы ищете, как подготовиться к собеседованию, эта серия статей для вас. Я буду помогать вам в моем собственном путешествии по собеседованиям при приеме на работу в Data Science. В этой серии интервью по науке о данных я затрону следующие темы: Python, машинное обучение, глубокое обучение, НЛП, статистика и многие другие. Наряду с этим я упомяну шаги и название компании.

Название компании: CitiusTech,продолжительность: 60 минут

Часть 1. Знакомство с вами и путешествием в науку о данных — 5 мин.

Часть 2: Подробно опишите свои проекты — 30-минутное обсуждение и вопросы о сквозном конвейере проекта, проблемах и решениях.

Часть 3. Теоретические вопросы — 20 минут
1. Каковы характеристики нормального распределения?
2. Что такое центральная предельная теорема?
3. Какой процент данных она покрывает, когда у нас есть 2 сигма значение в нормальном распределении вокруг среднего значения?
4. Что такое P-значение?
5. Что такое ошибка типа 1?
6. Почему среднее значение и дисперсия распределения яда совпадают?< br /> 7. Если у нас есть данные/переменная с низкой дисперсией и данные/переменная с высокой дисперсией, какие из них, по вашему мнению, подходят для модели машинного обучения?

Часть 4: Понимание кода — 5 минут
Поймите приведенный код и объясните мне — что здесь написано и что будет на выходе всего кода. (Проект машинного обучения с классом DumbModel, имеющим различные определяемые пользователем функции)

Часть 4. Если у вас есть какие-либо вопросы — 5 минут
Обсуждение роли и должностных обязанностей, а также стека технологий.

Название компании: Retail Capital, Продолжительность: 60 мин.

Часть 1. Введение и объяснение ваших проектов по науке о данных — 5 минут

Часть 2: Обсуждение проектов, понимание данных, понимание медицинских терминов, развертывание,

Часть 3: Программирование на Python
1. Что такое классификация с несколькими метками и чем она отличается от классификации с несколькими классами
2. Можем ли мы построить классификацию с несколькими метками, используя Random Forest
3. Что такое что такое модель BERT?
4. Что такое графы знаний?
5. Что такое ненаправленный, однонаправленный и двунаправленный граф?

Часть 4: Кодирование Python

Название компании: Prisonforce.ai, Продолжительность: 60 минут

Часть 1. Введение и объяснение ваших проектов по науке о данных — 5 минут

Часть 2. Теоретические вопросы — 25 минут
1. Что такое анализ временных рядов?
2. Что такое авторегрессия (AR)
2. Приведите мне реальный пример скользящего среднего и AR
3. Что такое сигмовидная функция в логистической регрессии
4. Что если мы рассмотрим какую-то другую функцию активации в логистической регрессии, какой результат мы должны ожидать?
5. Объясните архитектуру LSTM
6. Каков диапазон функции tanh
7. Что, если мы поменяем местами функции активации в LSTM (сигмоид на tanh и tanh на сигмоид), какой результат мы должны получить ожидать, это неправильно или что?
8. Что такое Центральная предельная теорема?

Часть 3. Основные вопросы — 15 мин.
1. Объясните, как обычно работает НЭР
2. Разница между традиционным НЭР и спайси

Часть 4. Вероятностные вопросы — 5 минут
1. Предположим, что изначально у нас в мешке всего один шарик (и мы не знаем его цвета), а затем мы добавили в мешочек еще один красный шарик и перетасовали это. Какова вероятность того, что из мешка выпадет красный шар?
2. Если у нас есть числа от 0 до бесконечности, какова вероятность того, что число делится на 120?

Я добавлю вопросы о процессе интервью других компаний в следующую серию, следите за обновлениями!