Привет, это Хамна. Это первый проект машинного обучения в этом проекте. Я собираюсь посмотреть, как вы можете создать систему прогнозирования качества вина с использованием машинного обучения, которая может прогнозировать качество вина с использованием некоторых химических параметров, хорошо ... Сначала давайте лучше разберемся с этой постановкой задачи, рассмотрим что есть винодельческая компания, эта компания хочет создать новый бренд вина, и давайте приедем. Я хочу определить качество вина, используя несколько химических параметров, таких как кислотность, содержание лимонной кислоты, содержание сахара и т. д. хорошо, так что я собираюсь делать Собираюсь создать систему машинного обучения. который может принимать все эти химические значения или химические параметры и сообщать вам, хорошее ли качество вина или хорошее качество вина, так что это постановка проблемы, теперь я понимаю рабочий процесс, который я собираюсь использовать поток для этого конкретного варианта использования в порядке, поэтому первым шагом является получение набора данных, чтобы набор данных вина, который имеет эти значения химических параметров и значение этикетки, поэтому здесь этикетка - это не что иное, как качество вина в порядке, поэтому я буду тренироваться моя модель машинного обучения с использованием этого помеченного набора данных, поэтому, когда вы тренируете модель машинного обучения с помеченными наборами данных, такой тип обучения называется контролируемым обучением, поэтому, когда вы используете немаркированный набор данных, он называется неконтролируемым обучением, поэтому, как только я эти прекрасные данные. Я проведу некоторый анализ этого набора данных. Итак, что это за анализ данных, поэтому у меня есть несколько значений или несколько параметров в этом наборе данных, поэтому мне нужно найти, какие параметры важны для обеспечения качества вино как хорошее ока. поэтому между различными характеристиками значений может быть несколько взаимосвязей, например, я сказал вам, что буду анализировать значения кислотности содержания лимонной кислоты и т. д., поэтому мне нужно найти взаимосвязь между содержанием лимонной кислоты и качество вина, поэтому мне нужно проверить, увеличивается ли качество, если мне нужно увеличить содержание лимонной кислоты и другие подобные вещи, чтобы все это было сделано в части анализа данных, и я также буду использовать методы визуализации, такие как графики и графики, чтобы понять это, поэтому эта часть известна как анализ данных. Эта часть анализа данных дает вам лучшее понимание набора данных, который у вас есть однажды. Я проанализировал набор данных вина, я предварительно обработал данные, поэтому этот шаг называется предварительной обработкой данных, поэтому я не могу передать эти необработанные данные в модель машинного обучения, поэтому мне нужно выполнить некоторую обработку, чтобы она стала совместимой с моей моделью машинного обучения поэтому, как только мы обрабатываем данные, появляется еще один важный шаг, называемый разделением теста на обучение, поэтому на этом конкретном этапе я разделю свой исходный набор данных на данные обучения и тестовые данные, поэтому причина этого в том, что я буду обучать модель машинного обучения, используя этот обучающие данные, и я не буду показывать эти тестовые данные моей модели машинного обучения для обучения, эти дисковые данные используются для оценки модели, чтобы определить, насколько хорошо работает моя модель, поэтому это причина для разделения данных на обучающие и тестовые данные, где обучение данные используются для обучения модели обучению на основе данных, а тестовые данные используются для оценки или тестирования модели в порядке, поэтому я буду кормить эти обучающие данные, чтобы моя модель машинного обучения, поэтому в этом случае я собираюсь использовать случайные форы Так что случайный лес является одним из наиболее важных алгоритмов машинного обучения суперуучения, поэтому я объясню вам базовое функционирование случайного леса, пока я реализую это мой код, так что, как только я изучу эту модель случайного леса, я будет оценивать его на основе моих тестовых данных нормально, так что он дает оценку точности или метрики производительности моей модели машинного обучения хммм ока, так что, как только я это сделаю. У меня будет обученная модель случайного леса, так что произойдет следующее: когда вы предоставите новые данные, эти химические параметры этой модели поезда могут предсказать качество вина, так что это рабочий процесс, я буду следовать этому конкретному варианту использования, поэтому, Я начну кодирование на jupyter notebook. Ок, это точка набора данных о качестве красного вина csv, так что это файл csv, который я получил от KAGGLE. так что вы можете просто искать данные о качестве вина в kaggle.

А теперь давайте перейдем к кодированию, посмотрим, что часть сеанса кодирования - это мой репозиторий.

«hamnakhalid / Wine-Quality-Prediction
Этот ядро ​​посвящено прогнозированию качества вина с использованием машинного обучения с Python. Это одна из важных машин… github.co »



Прогноз качества вина