Математика для машинного обучения охватывает области статистики, вероятности, многомерного исчисления, линейной алгебры, дискретной математики, оптимизации. Это основные из них, необходимые для того, чтобы дать толчок любому новичку.

Я следовал этой дорожной карте во время моего последипломного курса Data Science, и это очень помогло мне подготовиться к собеседованиям по машинному обучению.

Дорожная карта статистики

1. ОСНОВНАЯ СТАТИСТИКА

  • Типы данных: номинальные, порядковые, дискретные, непрерывные.
  • Описательная и логическая статистика
  • Моменты
  • Среднее, Медиана, Режим
  • Асимметрия
  • Эксцесс
  • Диапазон, IQR
  • Процентили, квартили
  • Среднее отклонение
  • Среднеквадратичное отклонение
  • Дисперсия
  • Квартильное отклонение
  • Стандартная ошибка

2. ДИАГРАММЫ

  • Таблица распределения частот
  • График
  • Гистограмма
  • Гистограмма
  • Полигон частот
  • Круговая диаграмма
  • Ogives

3. ФУНКЦИИ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ

  • Случайные переменные
  • Многомерные случайные величины
  • Дискретные случайные величины
  • Непрерывные случайные величины
  • Закон больших чисел
  • Ожидание
  • PMF - функция массы вероятности
  • PDF - Функция плотности вероятности
  • CDF - функция кумулятивной плотности
  • Распределение Бернулли
  • Биномиальное распределение
  • Геометрическое распределение
  • Распределение Пуассона
  • Экспоненциальное распределение
  • Равномерное распределение
  • Гауссово / нормальное распределение
  • Распределение хи-квадрат
  • Распределение степенного закона
  • Распределение Парето
  • Преобразование Бокса-Кокса
  • Логнормальное распределение
  • Оценка плотности ядра
  • График Q-Q

4. ВЕРОЯТНОСТЬ

  • Основная вероятность
  • Совместная вероятность
  • Условная возможность
  • Независимые события
  • Взаимоисключающие события
  • Теорема Байеса

5. ИСПЫТАНИЯ / ОТБОРЫ / НАСЕЛЕНИЕ

  • Выборка, среднее значение выборки и распределение
  • Центральная предельная теорема
  • Точечная оценка, оценка интервала
  • Доверительный интервал
  • Население, среднее значение и распределение
  • Проверка гипотезы
  • P-значение
  • Пропорции населения
  • Критическое значение
  • Уровень значимости
  • Области отклонения
  • Ошибки типа I и типа II
  • Один хвост против двух хвостов
  • Z-тест
  • Т-тест
  • ANOVA
  • F-тест
  • Тест хи-квадрат
  • Моделирование Монте-Карло
  • A / B тестирование

6. ОТНОШЕНИЯ / РЕГРЕССИЯ

  • Причинно-следственная связь
  • Ковариация
  • Ковариационная матрица
  • Корреляция
  • Диаграммы разброса
  • Коэффициент корреляции Пирсона
  • Коэффициент корреляции ранг / Спирмена
  • Оценка R2
  • Линейная регрессия
  • OLS
  • Факторный анализ
  • Логистическая регрессия

Дорожная карта линейной алгебры

1. ЛИНЕЙНЫЕ УРАВНЕНИЯ

  • Системы линейных уравнений
  • Исключение по Гауссу
  • Форма эшелона
  • Линейная комбинация
  • Охватывать
  • Однородная линейная система
  • Линейная независимость
  • Подпространство
  • Основа
  • Аффинное пространство
  • Линейное преобразование

2. МАТРИЦА

  • Матричные преобразования
  • Умножение матриц
  • Обратная матрица
  • Транспонировать матрицу
  • Ранг матрицы
  • Симметричная матрица
  • Ортогональная матрица
  • Сопряженная матрица
  • Сингулярная матрица
  • Определитель матрицы
  • След матрицы

3. ВЕКТОРЫ

  • Компоненты Vector
  • Векторное пространство
  • Норма вектора
  • Длины и расстояния
  • Евклидова норма
  • Манхэттен Норма
  • Минковский Расстояние
  • Скалярное умножение
  • Скалярное произведение
  • Внутренний продукт
  • Перекрестный продукт
  • Ортогональность
  • Ортонормированный
  • Вращения

4. ФАКТОРИЗАЦИЯ

  • Разложение матрицы
  • LU разложение
  • QR-разложение
  • Разложение Холецкого
  • Собственное разложение
  • Собственные значения
  • Собственный вектор
  • Разложение по сингулярным значениям
  • Анализ главных компонентов

Дорожная карта расчетов

1. ОСНОВЫ РАСЧЕТА

  • Функции
  • Производные
  • Максима Минима
  • Дифференциация продуктов и правил цепочки
  • Составные функции
  • Частные производные
  • Производные высшего порядка
  • Интегралы
  • Пределы
  • Суммирование бесконечных рядов

2. ОПТИМИЗАТОРЫ

  • Градиентный спуск
  • Оптимизаторы
  • Функции потерь
  • Серия Тейлора
  • Оптимизация с ограничениями (множитель Лагранжа)
  • Метод Ньютона в оптимизации
  • Выпуклая оптимизация

Бесплатные ресурсы YouTube:

Кредиты для 3Blue1Brown, Khan Academy, StatQuest с Джошем Стармером.

Спасибо, что прочитали статью! Если вам понравилась моя статья, сделайте 👏. Я пропустил какую-нибудь важную тему? Дай мне знать в комментариях. Я обновлюсь!

Свяжитесь со мной в Linked-in для получения дополнительных обновлений или любой помощи, связанной с продвижением вперед в вышеуказанных темах.