Скрытый двигатель машинного обучения

Алгебра впервые взята из книги, написанной Хорезми (780-850 гг. Н. Э.), Которая посвящена вычислениям и уравнениям. Это раздел математики, в котором буквы используются вместо цифр. Каждая буква может обозначать определенное число в одном месте и совершенно другое число в другом. Обозначения и символы также используются в алгебре, чтобы показать взаимосвязь между числами. Я помню, что около 17 лет назад, когда я был обычным студентом прикладной математики (сегодня это обычный выпускник!), Мне было очень любопытно узнать о некоторых исследованиях по алгебре, проведенных Марьям Мирзахани (1977–2017) в Гарвардском университете по аналогичной задаче счета. Эта наука сильно развивалась на протяжении всей истории и теперь включает в себя множество разделов.

Элементарная алгебра включает в себя основные операции над четырьмя основными операциями. После определения знаков, которыми разделяются фиксированные числа и переменные, используются методы для решения уравнений. Многочлен - это выражение, представляющее собой сумму конечного числа ненулевых членов, каждый член состоит из произведения константы и конечного числа переменных, возведенных в степень целого числа.

Абстрактная алгебра или современная алгебра - это группа в семействе алгебр, изучающая сложные алгебраические структуры, такие как группы, кольца и поля. Алгебраические структуры и связанные с ними гомоморфизмы образуют математические категории. Теория категорий - это формализм, позволяющий унифицированным способом выражать свойства и конструкции, схожие для различных структур. Абстрактная алгебра так популярна и используется во многих областях математики и инженерных наук. Например, алгебраическая топология использует алгебраические объекты для изучения топологий. Гипотеза Пуанкаре, доказанная в 2003 году, утверждает, что фундаментальная группа многообразия, кодирующая информацию о связности, может использоваться для определения того, является ли многообразие сферой или нет. Алгебраическая теория чисел изучает различные числовые кольца, которые обобщают множество целых чисел.

Я считаю, что наиболее влиятельным разделом алгебры в других науках является линейная алгебра. Предположим, вы вышли на пробежку, что в наши дни нелегко из-за изоляции от COVID-19, и внезапно все ваше внимание привлекает красивый цветок. Пожалуйста, не спешите выбирать, просто сделайте снимок, и другим тоже понравится. Через некоторое время, когда вы посмотрите на это изображение, вы сможете распознать цветок на изображении, потому что человеческий мозг эволюционировал в течение миллионов лет и способен обнаруживать такие вещи. Мы не осознаем операций, которые происходят в фоновом режиме нашего мозга и позволяют нам распознавать цвета на изображении, они обучаются делать это за нас автоматически. Но сделать это с помощью машины непросто, поэтому это одна из самых активных областей исследований в области машинного обучения и глубокого обучения. Собственно, фундаментальный вопрос: «Как машина хранит это изображение?» Вы, наверное, знаете, что современные компьютеры предназначены для обработки только двух чисел, 0 и 1. Как можно сохранить подобное изображение с различными функциями? Это делается путем сохранения интенсивности пикселей в структуре, называемой «матрицей».

Основные темы линейной алгебры - векторы и матрицы. Векторы - это геометрические объекты, имеющие длину и направление. Например, мы можем упомянуть скорость и силу, оба из которых являются векторными величинами. Каждый вектор представлен стрелкой, длина и направление которой указывают размер и направление вектора. Добавление двух или более векторов может быть выполнено на основе простоты использования с использованием методов параллелограмма или метода изображений, в котором каждый вектор раскладывается на его компоненты по осям координат. Векторное пространство - это набор векторов, которые можно складывать и умножать на скаляры. Скаляры обычно можно взять из любого поля, но обычно это реальные числа.

Матрица - это упорядоченный массив чисел в 2 измерениях, обычно m строк и n столбцов. Если две матрицы имеют одинаковый размер, что означает, что каждая матрица имеет одинаковое количество строк и такое же количество столбцов, как и другая, их можно добавлять или вычитать поэлементно. Мы можем умножать матрицы только тогда, когда количество столбцов в первой матрице совпадает с количеством строк во второй. Например, предположим, что внутренние размеры одинаковы: n для матрицы (m × n) умножается на (n × p), а затем получается матрица (m × p).

Еще одно важное понятие, широко используемое в машинном обучении, - это тензор. Тензор - это алгебраический объект, который описывает полилинейную связь между наборами алгебраических объектов, связанных с векторным пространством. Тензоры могут принимать несколько различных форм, в общем, двумерные и более высокие двумерные тензоры также известны как матрицы. Матрицы используются для создания порядка между данными проблемы и классификацией информации о ней.

Например, при обработке изображений используется тензор: одно измерение для ширины, одно измерение для высоты и одно для цветов, а также одно для информации о фокусе. Чтобы связать все концепции, мы узнали выше, можно сказать, тензор с нулевой размерностью - это скаляр, с одним измерением - вектор и, наконец, с двумя измерениями - это матрица. В последние годы были разработаны библиотеки для использования в языках программирования, чтобы облегчить использование тензоров, а также их быструю обработку. Одним из них является TensorFlow, разработанный Google. Google также разработал специальную интегральную схему под названием Tensor Processor Unit (TPU) для эффективных и быстрых тензорных вычислений для нейронных сетей.

Собственный вектор и собственное значение - другие важные концепции, широко используемые в машинном обучении. Собственный вектор линейного преобразования - это ненулевой вектор, который изменяется на скалярный коэффициент, когда к нему применяется это линейное преобразование. Собственное значение - это специальный набор ненулевых масштабов, которые собственный вектор растягивал бы им. Если весы отрицательные, направление будет противоположным.

Приставка «собственный» происходит от немецкого языка и означает характеристику. Собственный вектор имеет различные приложения в инженерных науках, одним из которых является его применение в алгоритмах машинного обучения для выполнения операций редукции признаков и размерных операций.

В машинном обучении нам необходимы основы работы с данными в векторной и матричной форме, приобретение навыков решения систем линейных алгебраических уравнений, нахождения базовых разложений матриц и общее понимание их применимости. Фактически, вы должны знать, что такое векторы и матрицы и как с ними работать, включая сложную проблему собственных значений и собственных векторов, и как использовать их для решения проблем.

Если вы хотите узнать больше о линейной алгебре, не начинайте с нуля в академическом стиле. Положитесь на определения и попытайтесь решить некоторые проблемы с помощью алгоритмов машинного обучения и его скрытых методов.

использованная литература

Банерджи, Судипто; Рой, Аниндия (2014), Линейная алгебра и матричный анализ для статистики, Тексты в статистической науке (1-е изд.), Чепмен и Холл / CRC, ISBN 978–1420095388

Стрэнг, Гилберт (19 июля 2005 г.), Линейная алгебра и ее приложения (4-е изд.), Брукс Коул, ISBN 978–0–03–010567–8

Шарп Р.В. (21 ноября 2000 г.). Дифференциальная геометрия: Обобщение Картаном программы Эрлангена Кляйна. Springer Science & Business Media. п. 194. ISBN 978–0–387–94732–7.

Браун, Уильям А. (1991), Матрицы и векторные пространства, Нью-Йорк: М. Деккер, ISBN 978–0–8247–8419–5

Сиадати, Саман. (2014). Первый курс алгебры. 10.13140 / RG.2.2.16017.04962.