МАШИННОЕ ОБУЧЕНИЕ С PYTHON

Классификация цветов (набор данных ириса)

Построение модели классификации для набора данных Iris

Эта статья Medium на самом деле представляет собой краткое руководство по классификации цветов в наборе данных Iris. Это идеальный способ начать машинное обучение и искусственный интеллект с помощью Python.

Что такое набор данных Iris?

Набор данных Iris - это многомерный набор данных о цветах, представленный Рональдом Фишером в его статье 1936 года.

Мы можем использовать его, чтобы классифицировать цветы ириса по трем видам (setosa, versicolor или virginica) на основе измерений длины и ширины чашелистиков и лепестков. Набор данных ириса содержит 3 класса по 50 экземпляров в каждом, где каждый класс относится к типу растения ирис.

Предпосылки

  1. Аккаунт Google
  2. Базовые знания Python и Jupyter

Начиная

  1. Перейдите на colab.research.google.com (Google Colaboratory - от Google Research)
  2. Создайте новый блокнот Jupyter (.ipynb) и назовите его Iris.

Примечание: в этом проекте мы используем только один файл. Итак, если у вас есть sci-kit learn и pandas установлены на вашем компьютере, вы можете просто создать файл Python, например Iris.py, на своем компьютере.

Создание модели с использованием Python

Во-первых, импорт:

Мы будем использовать панд и классификатор дерева решений из научного набора.

Далее мы инициализируем набор данных:

Мы вызываем набор данных с rawgithubusercontent.com и сохраняем его как «df».

Затем мы установим X и Y и подгоним модель с помощью классификатора дерева решений:

Как только мы это сделали, мы берем входные переменные: длина чашелистики, ширина чашелистиков, длина лепестка и ширина лепестка.

И, наконец, предсказываем! (И отобразить прогноз)

Строки 3 и 4 в приведенном выше фрагменте кода предназначены для форматирования «res». Прогноз возвращается следующим образом:

[‘Setosa’]

Следовательно, нам нужно снять скобки.

И мы закончили. Это довольно просто, и это можно сделать, если у вас есть простые знания Python. Надеюсь, вам понравилось!