MSE (среднеквадратическая ошибка)

MSE рассчитывается путем получения среднего квадрата разницы между исходным и прогнозируемым значениями данных. Среднеквадратическая ошибка всегда положительна, и чем ближе значение к 0, тем лучше. Давайте посмотрим, как это вычисляется;

МСЭ:

  • 30 * -30 = 900

Следовательно, 2425/5 = 485.

поэтому N — это общее количество строк в наборе данных. Символ sigma означает, что разница между фактическими и прогнозируемыми значениями берется для каждого значения i в диапазоне от 1 до n.

Среднеквадратичное значение можно рассчитать как

from sklearn.metrics import mean_squared_error

actual_values = [4, 0.5, 2, 9]
predicted_values = [2.5, 0.0, 2, 8]

mean_squared_error(actual_values, predicted_values)

MAE (средняя абсолютная ошибка)

Эта ошибка в основном представляет собой абсолютную разницу между фактическими или истинными значениями и значениями, которые прогнозируются. Средняя абсолютная ошибка является обычной мерой ошибки оценки при анализе временных рядов.

мы находим разницу между фактическим значением и прогнозируемыми значениями для всех 5 значений и берем их положительное значение. Таким образом, даже если разница между фактическим и прогнозируемым значением отрицательна, мы берем положительное значение для расчета.

MAE = истинные значения — прогнозируемые значения

там 105/5=21

MAE берет среднее значение этой ошибки для каждой выборки в наборе данных и выдает результат . MAE более устойчив к данным с выбросами, если ему подается значение, что поезд не виден, просто он может очень хорошо работать с видимыми данными, но может с треском провалиться, когда сталкивается с реальными, невидимыми данными.

Средняя абсолютная ошибка может быть рассчитана как

from sklearn.metrics import mean_absolute_error

# predicting home prices 
predicted_home_prices = house_model.predict(X)
mean_absolute_error(y, predicted_home_prices)

Теперь мы все будем думать, что означают MAE и MSE для модели машинного обучения.

MAE: он не очень чувствителен к выбросам по сравнению с MSE, поскольку не наказывает за большие ошибки. Обычно он используется, когда производительность измеряется на непрерывных переменных данных. Он дает линейное значение, которое одинаково усредняет взвешенные индивидуальные различия. Чем ниже значение, тем выше производительность модели.

MSE: это одна из наиболее часто используемых метрик, но наименее полезная, когда один неверный прогноз разрушает возможности предсказания всей модели, т. е. когда набор данных содержит много шума. Это наиболее полезно, когда набор данных содержит выбросы или неожиданные значения (слишком высокие или слишком низкие значения). Лучше использовать значения, близкие к нулю.

Надеюсь, урок был полезен. Если мы что-то упустили, сообщите нам об этом в комментариях.😇

Ставьте лайки и делитесь с друзьями