Привет! Я интересовался концепциями машинного обучения с прошлой недели. На самом деле, я интересовался и раньше, но с тех пор я пытался глубоко погрузиться в машинное обучение, потому что я работал аналитиком данных в течение 11 месяцев, однако данные были частью моей работы, поэтому я уже занимался данными вещи. Я думаю, что составил хороший список для чтения по этой теме. В этой истории мы попытаемся понять, что такое линейная регрессия и что мы можем сделать, используя ее. После этого мы взглянем на Azure ML Studio и создадим нашу первую модель линейной регрессии на этих наборах данных.

Линейная регрессия

Как мы знаем, существует 3 типа машинного обучения. Регрессия происходит от типа машинного обучения с учителем. Этот тип машинного обучения требует использования помеченных данных. Мы разбиваем набор данных на две части: обучающие и тестовые данные. Мы обучаем модель с помощью набора данных поезда и оцениваем ее с помощью тестового набора данных.

В этой истории я не буду объяснять, что такое другие типы машинного обучения, что такое контролируемое обучение и т. Д.

Мы используем регрессионные модели для прогнозирования количества зависимых переменных с помощью независимых переменных.

Студия машинного обучения Azure

Приступим к созданию нашей первой модели машинного обучения. Для этого я воспользуюсь Azure ML Studio. Это бесплатная услуга до определенного момента. На самом деле, я не очень разбираюсь в этой платформе, но могу объяснить шаги создания простой модели.

Импортировать данные

Я собираюсь скачать наборы данных отсюда. Вы можете найти 2 набора данных. Я скачаю их оба, но в ML Studio я объединю их как единый набор данных.

Если вы не знаете, что такое Kaggle, вам стоит проверить эту историю. Я предоставлю вам простую информацию, вы можете бесплатно скачать наборы данных с Kaggle.

Когда вы войдете в ML Studio, вы попадете на страницу Эксперименты.

Возможно, вы получите пустую страницу, если раньше не создавали эксперимент. Я перехожу на страницу Наборы данных и нажимаю кнопку «Создать» внизу слева. Теперь мы можем импортировать наши наборы данных, которые мы уже загрузили с Kaggle. Нам нужно пройти по этому пути: Набор данных - ›Из локального файла -› Выбрать наборы данных.

Если мы уже успешно импортировали наборы данных, мы можем приступить к созданию эксперимента.

Создать эксперимент

Я снова перехожу на страницу «Эксперименты» и нажимаю кнопку «Создать».

Мы можем увидеть некоторые уже созданные примеры, предоставленные Azure ML Studio. Я собираюсь продолжить, нажав на опцию «Пустой эксперимент».

Мы можем создавать модели и рабочие процессы, используя компоненты, расположенные на левой боковой панели.

Приступим к созданию простой модели

Во-первых, нам нужно импортировать наборы данных, которые мы будем использовать. В этом случае я буду использовать компонент «Сохраненные наборы данных». Вы можете искать компоненты, используя панель поиска на левой боковой панели. Я собираюсь перетащить его в середину и уронить.

Я сбросил 2 набора данных. На самом деле, мы можем использовать их по отдельности, но я хочу использовать их вместе. Сначала я объединю их, после чего снова разделю их как 2 набора данных; тренируйся и тестируй.

Объединить 2 набора данных

В этом случае я воспользуюсь компонентом «Добавить строки». И я перетащу их из нижней точки в точки ввода компонента «Добавить строки». Я сделал это, потому что у них были одинаковые столбцы. Фактически, мы могли бы использовать их без объединения, но я хотел показать, как мы можем объединить 2 набора данных. Мы снова разделим его на 2 набора данных: наборы данных для тестирования и обучения.

Если вы наведете курсор на нижнюю точку компонента «Добавить строки» после нажатия кнопки «Выполнить», вы увидите параметр «Визуализировать». Если вы его используете, вы увидите 1000 строк. Если вы проделали то же самое для двух наборов данных, вы увидите 300 и 700 строк соответственно.

Разделить набор данных

Теперь нам нужно разделить набор данных на 2 части, обучить, проверить данные. Мы обучим модель с помощью набора данных поезда, и мы оценим оценку модели с помощью тестового набора данных. Я буду использовать компонент «Разделить данные» для разделения набора данных. Я перетаскиваю компонент под компонент «Добавить строки» и перетаскиваю точку внизу «Добавить строки» в компонент «Разделить данные».

Мы можем установить процентное соотношение, которое будет в процентах от данных обучения с правой стороны. В этом случае я установил% 75 (0,75) основного набора данных для обучающих данных, и тестовые данные будут% 25. ML Studio разделила его на 2 набора данных.

Есть 2 точки вывода, 1-я и 2-я. Мы используем 1-й для набора данных поезда и 2-й для тестового набора данных.

Модель обучения

Мы успешно разделили наш набор данных. Теперь нам нужно обучить модель. Я собираюсь использовать компоненты «Модель обучения» и «Линейная регрессия».

Я объединю вторую входную точку компонента «Train Model» с первой выходной точкой компонента «Split Data». После этого я объединю 1-й вход компонента «Модель обучения» с точкой выхода компонента «Линейная регрессия». И я выберу столбец «y» из «Train Model». В нашем случае мы попытаемся предсказать «y», используя «x».

Оценка модели

Мы уже создали нашу модель. Теперь нам нужно оценить (протестировать) нашу модель. Я собираюсь использовать компонент «Score Model». Как вы, наверное, помните, у нас есть тестовый набор данных, который мы будем использовать сейчас. Я объединю выходные данные компонента «Обучение модели» с 1-й входной точкой компонента «Score Model», а вторую входную точку компонента «Score Model» со ​​вторым выходом с компонентом «Split Data».

Мы можем увидеть прогнозируемые значения в столбце «Ярлык с оценкой».

Оценка модели

Теперь мы можем оценить модель. Для этого я воспользуюсь компонентом «Оценить модель». Я объединю выходную точку компонента «Оценка модели» с первой входной точкой компонента «Оценка модели».

Если мы наведем курсор на точку вывода компонента «Оценить модель», мы увидим кнопку «Визуализировать».

Последние мысли

Надеюсь, эта история была полезной и вам понравилась. Как я уже сказал, мой путь машинного обучения недолг. Я играю с такими программами, как ML Studio, чтобы понять суть машинного обучения. Я хотел познакомить вас с Azure ML Studio.

С уважением.