Сегодня я расскажу о двух источниках обучения:
- Книга от платформы O’Reilly «Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow».
- Практическое обучение DataCamp (Курс: контролируемое обучение с помощью Scikit Learn)
Источник обучения – платформа OReilly
Книга — Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow, 2-е издание
примеры кода доступны онлайн в виде блокнотов Jupyter по адресу https://github.com/ageron/handson-ml2.
Концепции, которые я усвоил из этой книги
- Примеры контролируемых алгоритмов
- k-ближайшие соседи
- Линейная регрессия
- Логистическая регрессия
- Машины опорных векторов (SVM)
- Деревья решений и случайные леса
- Нейронные сети
2. Примеры неконтролируемых алгоритмов
- Кластеризация
K-средние
ДБСКАН
Иерархический кластерный анализ (HCA)
- Обнаружение аномалий и обнаружение новизны
SVM одного класса
Изоляция Лес
- Визуализация и уменьшение размерности
Анализ главных компонентов (PCA)
Ядро PCA
Локально-линейное вложение (LLE)
t-распределенное стохастическое встраивание соседей (t-SNE)
- Изучение правила ассоциации
Априори
Эклат
Практика
Набор данных - цены на жилье в Калифорнии, 1990 г.
Задача состоит в том, чтобы использовать данные переписи населения Калифорнии для построения модели цен на жилье в штате.
Цель. Модель должна предсказывать медианную цену на жилье в любом районе с учетом всех остальных показателей.
Источник обучения: DataCamp
Трек навыков — основы машинного обучения с помощью Python
Курс 1 — Контролируемое обучение с помощью Scikit Learn
Набор данных — набор данных, полученный из Репозитория машинного обучения UCI, состоящий из голосов, сделанных конгрессменами Палаты представителей США.
Концепции, которые я практиковал здесь, следующие:
- k-классификация ближайших соседей
- Создание классификатора k-NN
Продолжим с этим в другой день.