МАШИННОЕ ОБУЧЕНИЕ С PYTHON
Классификация цветов (набор данных ириса)
Построение модели классификации для набора данных Iris
Эта статья Medium на самом деле представляет собой краткое руководство по классификации цветов в наборе данных Iris. Это идеальный способ начать машинное обучение и искусственный интеллект с помощью Python.
Что такое набор данных Iris?
Набор данных Iris - это многомерный набор данных о цветах, представленный Рональдом Фишером в его статье 1936 года.
Мы можем использовать его, чтобы классифицировать цветы ириса по трем видам (setosa, versicolor или virginica) на основе измерений длины и ширины чашелистиков и лепестков. Набор данных ириса содержит 3 класса по 50 экземпляров в каждом, где каждый класс относится к типу растения ирис.
Предпосылки
- Аккаунт Google
- Базовые знания Python и Jupyter
Начиная
- Перейдите на colab.research.google.com (Google Colaboratory - от Google Research)
- Создайте новый блокнот Jupyter (.ipynb) и назовите его Iris.
Примечание: в этом проекте мы используем только один файл. Итак, если у вас есть sci-kit learn и pandas установлены на вашем компьютере, вы можете просто создать файл Python, например Iris.py, на своем компьютере.
Создание модели с использованием Python
Во-первых, импорт:
Мы будем использовать панд и классификатор дерева решений из научного набора.
Далее мы инициализируем набор данных:
Мы вызываем набор данных с rawgithubusercontent.com и сохраняем его как «df».
Затем мы установим X и Y и подгоним модель с помощью классификатора дерева решений:
Как только мы это сделали, мы берем входные переменные: длина чашелистики, ширина чашелистиков, длина лепестка и ширина лепестка.
И, наконец, предсказываем! (И отобразить прогноз)
Строки 3 и 4 в приведенном выше фрагменте кода предназначены для форматирования «res». Прогноз возвращается следующим образом:
[‘Setosa’]
Следовательно, нам нужно снять скобки.
И мы закончили. Это довольно просто, и это можно сделать, если у вас есть простые знания Python. Надеюсь, вам понравилось!