Машинное обучение и наука о данных — самые быстроразвивающиеся технологии. В последние годы машинное обучение и наука о данных — одна из самых бурно развивающихся областей во всех отраслях промышленности по всему миру.

Данные становятся наиболее ценными в этом быстром темпе жизни, и это создает множество возможностей. Машинное обучение и наука о данных — это слияние компьютерных наук и статистики.

Но самая сложная часть жизненного цикла изучения данных и машинного обучения — это статистика.

Потому что статистика слишком обширна, и на ее завершение уходит 3–5 лет. Сообщество, занимающееся машинным обучением и наукой о данных, всегда ищет верный путь .

Предварительная статистика — базовый блок обучения

  • Что такое статистика и каковы ее типы?
  • Введение в вероятность
  • Правило добавления в вероятности
  • Правило умножения в вероятности
  • Описательная и выводная статистика
  • Население и выборка
  • Показатель центральной тенденции (среднее, медиана, мода)
  • Среднее значение генеральной совокупности и среднее значение выборки
  • Что такое метод выборки и его виды
  • Распределение населения, распределение выборки и распределение выборки
  • Мера дисперсии (дисперсия, стандартное отклонение)
  • Что такое переменные и их типы?
  • Диапазон
  • Шкалы измерения переменных
  • Распределение частоты и совокупная частота
  • Гистограммы

Pro Statistics — промежуточный блок обучения

  • Процентили и квантили
  • Обзор пяти чисел
  • Межквартильный диапазон (IQR)
  • Блочные диаграммы
  • Влияние выбросов и их удаление
  • Функция плотности вероятности
  • Нормальное распределение или распределение Гаусса и эмпирическая формула
  • Z-оценка
  • Стандартизация и нормализация
  • Стандартное нормальное распределение
  • Центральная предельная теорема
  • Неравенство Чебышева
  • Ковариация
  • Коэффициент корреляции Пирсона
  • Коэффициент ранговой корреляции Спирмена
  • Совокупная функция распределения
  • Оценка плотности ядра
  • Асимметрия данных

Максимальная статистика - Блок расширенного обучения

  • График QQ Проверка нормального распределения данных
  • Дискретное и непрерывное распространение
  • Распределение Бернулли и биномиальное число
  • Журнал нормального распределения
  • Распределение по степенному закону
  • Распределение Пуассона
  • Применение негауссовского распределения
  • Преобразование Box Cox
  • Все техники трансформации
  • Доверительный интервал в статистике
  • Ошибка типа 1 и типа 2
  • Односторонний и двусторонний тесты
  • Проверка гипотез, значение p
  • Этапы проверки гипотез
  • Нулевая гипотеза
  • Альтернативная гипотеза
  • T-тест
  • z-тест
  • Тест Annova
  • Тест Chisquare

Это должен быть полный путь изучения статистики.