Аналогия с говорением на языке без знания необходимой грамматики может дать намек на линейную алгебру как на знание для Data Scientist. Мы можем очень хорошо говорить на языке, но наступает момент — нам не хватает уверенности — и мы обращаемся за помощью (онлайн или офлайн), чтобы понять структуру предложения.

Линейная алгебра формирует основу для решения уравнений как основной части алгоритмов Data Science. Эта основа необходима для необходимой интуиции для разработки или настройки модели. В этом блоге я попытаюсь вдохновить вас на интерес к линейной алгебре, прежде чем переходить к поиску линии регрессии.

Во-первых, линейную алгебру можно использовать для решения сложных уравнений. Позвольте мне привести вам простой пример, чтобы найти цену на яблоки и бананы. Предположим, вы купили 3 яблока и 2 банана за 8 евро, а во второй раз купили 10 яблок и 1 банан за 13 евро.

Расположение чисел слева между фигурными скобками указывает на матрицу яблок и бананов и a, bи8, 13 — это векторы, которые помогают нам найти a и bцены на яблоки и бананы.

Другой вариант использования линейной алгебры — найти оптимальные значения параметров в уравнении для объяснения шаблона. Например, у нас есть гистограмма разной высоты населения.

Такое уравнение было бы удобно для объяснения распределения роста населения. На основании статистики кривая красного цвета может быть объяснена гауссовым распределением с µ и σ в виде двух векторов. Тем не менее, найти правильные параметры, которые лучше всего соответствуют этой кривой, непросто.

Если µ и σ — два вектора, движущиеся в пространстве, то качество гауссовой кривой распределения можно оценить по тому, насколько хорошо розовое пространство на приведенном выше рисунке обрабатывается (ожидается, что розовый пробел равен 0).

Синий пейзаж на приведенном выше рисунке представляет собой общее распределение уравнения качества с µ и σ в качестве векторов, а центр пространства находится там, где ожидается, что он даст оптимальная доброта. Итак, если бы мы могли найти самый крутой спуск с холма, то мы могли бы спуститься к точке минимума, к точке, где мы получаем наилучшую возможную подгонку.

Здесь мы предполагаем, что µ и σ являются векторами, их небольшие перемещения по пространству параметров для нахождения оптимальных значений. Векторы не обязательно должны быть просто геометрическими объектами в физическом порядке пространства. Они могут описывать направления вдоль любых осей.

Итак, если мы понимаем векторы и понимаем, как спуститься с холма, такая кривизна этой ценности добра — это исчисление. Затем, когда у нас есть исчисление и векторы, мы сможем решить уравнение для наилучшего соответствия.

Удачи и счастливого обучения…!