Машинное обучение — это разновидность искусственного интеллекта, которая позволяет компьютерам учиться на основе данных без явного программирования. Это как учить ребенка выполнять задачу, показывая примеры вместо того, чтобы давать пошаговые инструкции.

Вот краткий обзор основных концепций машинного обучения:

  1. Данные. Данные — это основа машинного обучения. Это исходный материал, который алгоритм машинного обучения использует для изучения закономерностей или взаимосвязей. Данные могут быть в виде текста, изображений, чисел или любого другого формата.
  2. Функции. Функции – это измеримые характеристики или свойства данных. Например, в наборе данных о ценах на жилье функции могут включать размер, местоположение и возраст домов.
  3. Ярлыки. Ярлыки — это результаты, которые мы хотим предсказать с помощью алгоритма. В примере с ценой дома метка будет фактической ценой дома.
  4. Модель. Модель – это математическое представление взаимосвязи между функциями и ярлыками. Это «мозг», который учится на данных.
  5. Обучение. Обучение — это процесс ввода данных (функций и меток) в алгоритм машинного обучения для создания модели. Алгоритм анализирует данные и пытается обнаружить закономерности или взаимосвязи между функциями и метками.
  6. Тестирование. Тестирование — это процесс оценки производительности обученной модели на новых, неизвестных ранее данных. Это помогает нам определить, насколько хорошо модель обобщается на новые ситуации.
  7. Оценка. Оценка — это процесс измерения производительности модели. Обычно мы используем такие показатели, как точность, достоверность, полнота и оценка F1, чтобы оценить, насколько хорошо работает модель.

Начнем с самых основ. Мы сосредоточимся на одной концепции за раз, чтобы вы поняли все.

Шаг 1. Понимание данных

В машинном обучении данные — это исходный материал, который мы используем для обучения нашим алгоритмам. Думайте о данных как об ингредиентах рецепта. Чем лучше ингредиенты, тем лучше конечное блюдо. Данные могут поступать во многих формах, таких как числа, текст, изображения или аудио.

Для нашего первого урока давайте сосредоточимся на простом наборе данных с числовыми данными. Представьте, что у нас есть следующие данные о росте (в дюймах) и весе (в фунтах) группы людей:

Рост: [62, 64, 68, 70, 72, 74]
Вес: [120, 130, 145, 160, 180, 200]

Наша цель — создать модель машинного обучения, которая может предсказывать вес человека на основе его роста. В данном случае «высота» — это признак, а «вес» — метка.

Шаг 2. Выбор алгоритма

Есть много алгоритмов машинного обучения на выбор, но мы начнем с простого под названием «Линейная регрессия». Линейная регрессия используется для поиска взаимосвязи между одной или несколькими независимыми переменными (признаками) и непрерывной зависимой переменной (меткой).

В нашем случае у нас есть одна независимая переменная (рост) и одна зависимая переменная (вес).

Шаг 3. Подготовка данных

Прежде чем вводить данные в алгоритм, нам нужно разделить их на две части: обучающую выборку и проверочную выборку. Обучающий набор используется для обучения алгоритма, а тестовый набор используется для оценки его производительности.

Давайте используем первые 4 точки данных для обучения и последние 2 для тестирования:

Тренировочный набор:
Рост: [62, 64, 68, 70]
Вес: [120, 130, 145, 160]

Набор для тестирования:
Рост: [72, 74]
Вес: [180, 200]

Шаг 4. Обучение модели

Теперь мы передадим обучающие данные в алгоритм линейной регрессии для создания модели. Алгоритм проанализирует данные и попытается обнаружить закономерность или взаимосвязь между ростом и весом. В этом случае алгоритм найдет наиболее подходящую прямую, представляющую это отношение.

Шаг 5. Тестирование модели

Когда у нас будет обученная модель, мы будем использовать данные тестирования для оценки ее производительности. Мы введем высоты из тестового набора, и модель предскажет соответствующие веса. Затем мы можем сравнить предсказанные веса с фактическими весами, чтобы увидеть, насколько точна наша модель.

Шаг 6. Оценка модели

Существует несколько способов измерения производительности модели. Для линейной регрессии общий показатель называется Mean Squared Error (MSE), который вычисляет среднее квадрат разницы между прогнозируемым и фактическим значениями. Чем ниже MSE, тем лучше производительность модели.

К этому моменту вы изучили основные этапы создания модели машинного обучения с использованием линейной регрессии. На следующем уроке мы рассмотрим масштабирование функций.