Программа Data Science 2022 для начинающих

1) Введение в науку о данных

Вы должны знать о том, что такое наука о данных, что включает в себя наука о данных, для чего она используется, эра науки о данных, бизнес-аналитика против науки о данных,

Использование бизнес-аналитики, Где она используется, Жизненный цикл науки о данных, Инструменты науки о данных, Введение в Python

2) Инструменты, используемые в науках о данных

Апач Хадуп
Таблица
ТензорФлоу
BigML
Excel
PowerBI
Апач Спарк
MongoDB
питон
R
Апач Кафка
Гугл Аналитика
Юлия
SPSS
МАТЛАБ
САС

2) Извлечение данных, обработка и визуализация

Такие темы, как извлечение данных, конвейер анализа данных, типы данных, необработанные и обработанные данные, обработка данных, исследовательский анализ данных.

Визуализация данных, загрузка различных типов наборов данных в Python, организация данных, построение графиков

3)Введение в машинное обучение с помощью Python

Освойте основные версии Python (numpy, Pandas, scikit Learn, matplotlib), необходимое машинное обучение с библиотеками Python.

Дайте определение машинному обучению, Обсудите примеры использования машинного обучения, Перечислите категории машинного обучения с использованием Python, Проиллюстрируйте алгоритмы контролируемого обучения,

Идентифицируйте и распознавайте алгоритмы машинного обучения вокруг нас. Понимайте различные элементы алгоритма машинного обучения, такие как параметры, гиперпараметры, функция потерь и оптимизация.

Также важны такие темы, как варианты использования машинного обучения. Процесс машинного обучения, категории машинного обучения, линейная регрессия, градиентный спуск, линейная регрессия — использование набора данных Boston.

Обучение под наблюдением — я

Понимать, что такое контролируемое обучение, иллюстрировать логистическую регрессию, определять классификацию, объяснять различные типы классификаторов, такие как дерево решений и случайный лес

Что такое классификация и варианты ее использования, что такое дерево решений, алгоритм индукции дерева решений, создание идеального дерева решений, матрица путаницы, что такое случайный лес, реализация логистической регрессии, дерево решений, случайный лес

Уменьшение размерности

Также такие темы, как Введение в размерность, Почему уменьшение размерности, PCA, Факторный анализ, Масштабирование многомерной модели, LDA, Практическое обучение PCA, Масштабирование

Контролируемое обучение — II

Что такое наивный байесовский алгоритм, как работает наивный байесовский классификатор, реализация наивного байесовского классификатора, что такое машина опорных векторов, проиллюстрировать, как работает машина опорных векторов

Оптимизация гиперпараметров, поиск по сетке, случайный поиск, реализация машины опорных векторов для классификации

Неконтролируемое обучение

Что такое кластеризация и варианты ее использования, Что такое кластеризация K-средних, Как работает алгоритм K-средних, Как выполнить оптимальную кластеризацию, Что такое кластеризация C-средних, Что такое иерархическая кластеризация, Как работает иерархическая кластеризация

Ассоциация правил майнинга и систем рекомендаций

Что такое правила ассоциации, параметры правила ассоциации, расчет параметров правила ассоциации, механизмы рекомендаций, принцип работы механизмов рекомендаций, совместная фильтрация, фильтрация на основе содержимого

Обучение с подкреплением

Что такое обучение с подкреплением, почему обучение с подкреплением, элементы обучения с подкреплением, дилемма исследования и эксплуатации, жадный алгоритм эпсилон, марковский процесс принятия решений (MDP), значения Q и значения V, обучение Q, значения α

Анализ временных рядов

Что такое анализ временных рядов, важность TSA, компоненты TSA, белый шум, модель AR, модель MA, модель ARMA, модель ARIMA, стационарность, ACF и PACF

Выбор модели и бустинг

Что такое выбор модели, Необходимость выбора модели, Перекрестная проверка, Что такое бустинг, Как работают алгоритмы бустинга, Типы алгоритмов бустинга, Адаптивный бустинг