По этой статье я начал изучать первую книгу в списке. [Глубокое обучение (серия адаптивных вычислений и машинного обучения). Документация на Medium нескольких концепций, которые были прекрасно освещены в книге, является первой публикацией в серии, посвященной векторным нормам — одной из фундаментальных тем линейной алгебры.

Что такое вектор?

Вектор — это просто массив чисел, обозначающий точку в n-мерном пространстве. В науке о данных эта точка может представлять, скажем, экземпляр дома, а каждое из чисел — некоторое «свойство» или особенность дома.

Например, пусть следующие характеристики (n = 4) дома, которые мы хотим рассмотреть, —

  • количество спален
  • количество ванных комнат
  • количество балконов
  • возраст дома (текущий год-год постройки)

[3,3,1,3] — это вектор, представляющий дом, каждый из номеров которого соответствует перечисленным выше функциям.

Поскольку идея вектора ясна, одной из важных мер в науке о данных является определение величины или размера вектора. Это дается тем, что называется «нормой». Норма – это, по сути, функция, которая отображает вектор в одно неотрицательное число.

Норма в «p-форме» определяется как:

Евклидова норма

Когда p = 2, норма называется евклидовой нормой, которая часто используется в машинном обучении. Он также известен как SRSS или квадратный корень из суммы квадратов.

Для примера с домом евклидова норма определяется выражением

Манхэттенская норма

1-норма, также известная как Манхэттенская норма, представляет собой сумму абсолютных значений характеристик, определяемых как:

Для примера дома манхэттенская норма определяется как

Макс. норма

Максимальная норма дает абсолютное значение наибольшего признака.

Изоповерхности нормы Lp

Для простоты и возможности визуализации рассмотрим только две функции вместо четырех. Предположим, мы хотим построить следующий график для p = 0,5,1 и 2; т.е. постройте характеристики x1 и x2 так, чтобы норма Lp была константой, скажем, равной 1

Визуализация норм L1 и L2 полезна для понимания различий между гребенчатой ​​и лассо-регрессией (которые представляют собой два метода регуляризации), в частности, почему для выбора признаков можно использовать L1 или Lasso, а не L2.

Обратите внимание на ромбовидную форму графика L1 по сравнению с круглой формой графика нормы L2.

Если вы ранее работали с методами регуляризации, вы сможете оценить, как геометрические свойства этих фигур определяют точку пересечения контуров функции стоимости и норм.

Методы регуляризации потребуют отдельного блога и выходят за рамки этого блога.

Надеюсь, вы получили некоторое представление о нормах после прочтения этого. Спасибо за ваше время!