Линейная алгебра для науки о данных и машинного обучения

Автор: Нишикант Дилип Мундокар, магистр науки о данных и пространственной аналитики, Институт геоинформатики Symbiosis, Пуна.

Линейная алгебра имеет решающее значение в науке о данных и машинном обучении. Изучающие науку о данных и опытные практики должны хорошо понимать фундаментальные идеи линейной алгебры. Новички должны ознакомиться с основными понятиями линейной алгебры, прежде чем начать карьеру в науке о данных или машинном обучении.

Линейная алгебра — это область математики, которая пригодится для науки о данных и машинного обучения. В машинном обучении линейная алгебра является наиболее эффективным математическим навыком. Большая часть алгоритмов мл может быть записана в виде матрицы. Матрица — это типичное представление набора данных. Подготовка данных, преобразование данных и оценка модели включают линейную алгебру. Ниже приведены темы, с которыми вам следует ознакомиться.

  1. Векторные пространства
  2. Матричная алгебра
  3. Скалярные произведения и ортогональность
  4. Собственные значения и диагонализация матрицы
  5. Разложение по сингулярным значениям
  6. Детерминанты

1) Векторные пространства:

1. Суммирование векторов объединяет их хвост к голове

2. Умножение вектора на положительное действительное число k сохраняет его направление и умножает его норму на k.

Рис. Сложение векторов Рис. Скалярное умножение

Скалярное умножение обозначается размещением скаляра рядом с вектором, а сложение векторов обозначается знаком «+» между двумя векторами.

2) Матричная алгебра:

Матрица представляет собой прямоугольный массив чисел. Мы сообщаем размер матрицы как несколько строк по некоторым столбцам. Другими словами, матрица с m строк и n столбцов называется матрицей размера m × n. Назовем элемент в i-й строке и j-м столбце матрицы A элементом A (i, j) и обозначим его через Ai,j. В Julia или Python запись (i, j) может обозначаться как A[i,j]. Матрицу размера m × n можно рассматривать как линейное преобразование Rn в Rm.

3) Скалярные произведения и ортогональность:

Два вектора ортогональны, если угол между ними равен 90 градусов. Таким образом, используя (**), мы видим, что скалярное произведение двух ортогональных векторов равно нулю. Таким образом, скалярное произведение двух ненулевых векторов равно нулю тогда и только тогда, когда они ортогональны. Если два вектора перпендикулярны друг другу, то говорят, что они ортогональны. Другими словами, скалярное произведение двух векторов равно нулю. Значение. Если каждая пара векторов ортогональна, мы говорим, что набор векторов v1, v2, vn взаимно ортогонален.

4) Собственные значения и диагонализация матрицы:

В науке о данных и машинном обучении линейная алгебра является ключевым методом. Мы продемонстрировали фундаментальные понятия, такие как размер матрицы, используя набор данных технологических акций. В результате любой, кто интересуется наукой о данных, должен ознакомиться с основными идеями линейной алгебры из первых рук.

5) Разложение по единственному значению:

В этом разделе мы объединим полярное разложение и спектральную теорему, чтобы получить одну из самых мощных идей линейной алгебры: разложение по сингулярным числам. Полярное разложение говорит нам, что любая квадратная матрица A почти такая же, как некоторая симметричная матрица, а спектральная теорема говорит нам, что симметричная матрица почти такая же, как простое масштабирование вдоль координатных осей. (В обоих случаях фраза «почти одинаковая» маскирует композицию с ортогональным преобразованием.) Мы должны уметь комбинировать эти идеи, чтобы заключить, что любая квадратная матрица — это то же самое, что и простое масштабирование по осям координат.

Рис. Матрица A отображает один набор ортогональных линий сетки на другой

6) Детерминанты:

Определитель квадратной матрицы A — это одно число, которое содержит важную информацию о том, как ведет себя преобразование x 7 → Ax. В этом разделе мы разработаем геометрически мотивированное определение определителя

Существует относительно простая формула для def A в терминах элементов A. Например,

c - определитель матриц 2 × 2. Однако эта формула неэффективна, если A имеет много записей и все среды научных вычислений имеют функцию определения, которая использует гораздо более быстрые методы.