Сегодня я расскажу о двух источниках обучения:

  1. Книга от платформы O’Reilly «Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow».
  2. Практическое обучение DataCamp (Курс: контролируемое обучение с помощью Scikit Learn)

Источник обучения – платформа OReilly

Книга — Практическое машинное обучение с помощью Scikit-Learn, Keras и TensorFlow, 2-е издание

примеры кода доступны онлайн в виде блокнотов Jupyter по адресу https://github.com/ageron/handson-ml2.

Концепции, которые я усвоил из этой книги

  1. Примеры контролируемых алгоритмов
  • k-ближайшие соседи
  • Линейная регрессия
  • Логистическая регрессия
  • Машины опорных векторов (SVM)
  • Деревья решений и случайные леса
  • Нейронные сети

2. Примеры неконтролируемых алгоритмов

  • Кластеризация

K-средние

ДБСКАН

Иерархический кластерный анализ (HCA)

  • Обнаружение аномалий и обнаружение новизны

SVM одного класса

Изоляция Лес

  • Визуализация и уменьшение размерности

Анализ главных компонентов (PCA)

Ядро PCA

Локально-линейное вложение (LLE)

t-распределенное стохастическое встраивание соседей (t-SNE)

  • Изучение правила ассоциации

Априори

Эклат

Практика

Набор данных - цены на жилье в Калифорнии, 1990 г.

Задача состоит в том, чтобы использовать данные переписи населения Калифорнии для построения модели цен на жилье в штате.

Цель. Модель должна предсказывать медианную цену на жилье в любом районе с учетом всех остальных показателей.

Источник обучения: DataCamp

Трек навыков — основы машинного обучения с помощью Python



Курс 1 — Контролируемое обучение с помощью Scikit Learn



Набор данных — набор данных, полученный из Репозитория машинного обучения UCI, состоящий из голосов, сделанных конгрессменами Палаты представителей США.

Концепции, которые я практиковал здесь, следующие:

  1. k-классификация ближайших соседей
  2. Создание классификатора k-NN

Продолжим с этим в другой день.