Применение машинного обучения к более простым задачам не так уж и сложно, вам просто нужно запомнить несколько шагов, которые необходимо выполнить.

Проблема

Вы пират или капитан морской пехоты, но я думаю, что пират подойдет вам и планирует атаковать алмазный рудник под водой недалеко от какой-то страны, эта страна защитила алмазный рудник несколькими минами (взрыв) и Камни трудно различить, какие из них Мои, а какие Камни. Но удача в том, что у вас есть данные, и вы можете различать среди них, какие из них Мои, а какие Рок.

Шаг 1

Просто импортируйте все необходимые зависимости, которые вы можете прочитать об отдельной библиотеке, просто просмотрев документацию.

Шаг 2

Прочитайте данные через файл с помощью pandas. Наши данные хранятся в формате csv, поэтому мы будем использовать .read-csv. Он просто прочитает значения из файла в формате CSV и сохранит их как фрейм данных.

Наши данные выглядят примерно так

Шаг 3

Знайте о своих данных, чем больше вы знаете, тем лучше вы будете обращаться с ручкой. Однако следующий набор данных не содержит никакой информации о столбцах, но вы все же можете отметить распределение данных и сводку данных и обнаружить выбросы в наборе данных.

Шаг 4

Найдем распределение целевой переменной. Если данные не распределены, примите соответствующие меры для равномерного распределения данных.
Вы можете видеть, что распределение немного несбалансировано, но это приемлемо. Почти ни одна из данных не распределена одинаково.

R в целевой переменной представляет Rock, а M представляет Mine.

Шаг 5

Разделите цель и функции в наборе данных.

Шаг 6

Разделите данные на поезд и тестовый набор. Набор поездов будет использоваться для обучения модели, а набор тестов будет использоваться для проверки модели.

шаг 7

Выберите свою модель. Не существует каких-либо жестких и быстрых правил выбора модели, вам нужно попробовать несколько моделей и выбрать ту, которая превосходит другие. Однако мы просто используем логистическую регрессию, вы можете найти интуицию, лежащую в основе логистической регрессии, через Google.

Модель подбирается по данным, а затем делается прогноз по тестовым данным.

шаг 8

Оценка модели помогает вам определить лучшую модель, поскольку для классификации и регрессии используются разные показатели. Поскольку эта проблема связана с классификацией, мы можем использовать различные метрики, такие как матрица путаницы, F1-Score и некоторые другие. О метриках классификации можно прочитать здесь

Тада!!! Это все, что вы сделали с вашим проектом ML для начинающих.

Заключение

Этот проект был связан с классификацией Rocks vs Mines. Вы просто выполняете некоторую статистическую операцию и разделение данных для обучения и оценки вашей модели.