Это мой проект Наивного Байеса; анализ данных и прогнозирование качества вина на основе данных. Я использовал библиотеки Pandas, NumPy, Seaborn и Scikit для анализа данных и построения модели.

Я импортировал фрейм данных качества вина как данные с помощью pandas.

Теперь идет очистка, к счастью, наши данные уже очищены и готовы к анализу.

Теперь идет анализ данных, с помощью функции описания я проверяю, есть ли какие-либо выбросы, и с помощью парного графика я визуализирую данные.

После этого идет сборка модели, я разделил данные на независимую переменную (x) и целевую переменную (y).

Далее я разделил их на x_train, x_test, y_train и y_test с помощью функции «train_test_split» из Scikit Learn.

Я строю модель на данных x_train и y_train, используя GaussianNB из Scikit Learn, и с помощью функции «score» и матрицы путаницы мы видим, что скорость прогнозирования моделей довольно хорошая.

ВЫВОД

Я сделал все это, чтобы попрактиковаться в наивном байесовском классификаторе, и вот все, чему я научился, выполняя этот проект:

Узнали, как и когда использовать наивный байесовский классификатор.

Изучены преимущества Наивного байесовского классификатора перед другими алгоритмами.

Проект Github: Прогноз качества вина