M = среднее(T) | Т = сумма (S) | S = абсолютный (E) | Е = ошибка

Как следует из названия, брать абсолютную ошибку всех точек и брать среднее значение. Это в основном похоже на среднеквадратичную ошибку, за исключением того, что вместо квадрата используется абсолютная величина. Но свойства этих двух функций на данных совершенно разные. см. мой пост на MSE, если это необходимо. Это в основном используется для задач регрессии.

В приведенной выше формуле ошибка рассчитывается путем вычитания фактического значения из прогнозируемого значения из алгоритма.

На изображении показано, как MAE вычисляет ошибку, по которой алгоритмы судят о правильности его логики и вносят изменения.

Давайте возьмем показанный набор данных и проанализируем, как работает MAE с использованием Python и его популярных пакетов для построения графиков. Здесь мы возьмем простую линейную регрессию, поскольку наш набор данных имеет только один входной параметр (x).

Линейная регрессия — это метод статистического моделирования для исследования связи между зависимой переменной и независимой переменной (переменными) с непрерывными переменными.

Простая линейная регрессия — это «подгонка линии для всех точек с минимальной ошибкой и предсказание будущего»

На изображении показано соотношение между входными и выходными значениями для всех точек. Теперь линейная регрессия нарисует линию под названием «Линия регрессии» по точкам, чтобы они подходили одинаково (по расстоянию) к каждой точке.

Ошибка рассчитывается как абсолютное значение разницы между фактическим выходом и прогнозируемым выходом для точки x. Линия регрессии показывает, насколько модель соответствует данным.

Вот как я рассчитал MAE для выборочных данных, и он дал 2,41 в качестве значения ошибки. Для дальнейшего изучения, чтобы узнать, как MAE работает с выбросом в данных, я добавил x = 10 и Y = 100 к данным, которые будут выбросом к данным, поскольку значения Y малы для каждого X. Теперь MEA дает « 3,05 дюйма на выходе. Даже если мы добавим большую точку выброса, разница в выводе ошибок невелика, что означает, что на MAE большую часть времени не влияют выбросы.

Когда использовать?

Мы четко знали, что нет большой проблемы, когда в данных есть большой выброс.

  1. Когда нам нужно подавить эффект выбросов в наших данных.
  2. Когда ваши данные распределены симметрично.

Пример: Прогноз роста... Если вы пытаетесь предсказать рост человека, используя его возраст, мы знали, что в большинстве случаев не будет никаких выбросов. Для этого мы можем использовать MAE.

Это пока все, что касается МАЭ. Я буду обновлять в конце концов всякий раз, когда я получаю что-то новое об этом. Спасибо, пока. Счастливый мл.