Введение в математику искусственных нейронных сетей

Руван Раджапаксе, ЧП

Искусственные нейронные сети были вдохновлены нейронами в мозгу. Нейроны — это в основном клетки головного мозга.

Теперь сначала давайте посмотрим на нейрон.

На приведенном выше рисунке показан нейрон. Схематично этот нейрон можно представить следующим образом.

В нейроне к телу клетки поступает множество входов. В теле клетки и в аксоне происходит некоторая обработка.

Затем выходные данные выдаются из терминалов аксона.

Входы поступают в тело клетки. Х1, Х2, Х3… и т.д.

Они объединяются. Σ Xi (символ Σ указывает на добавление всех входов)

Совокупный эффект входов обрабатывается или, говоря математическим языком, подвергается функции.

F (Σ Xi)

Затем создается вывод.

В искусственной нейронной сети этот процесс несколько изменен.

Теперь давайте посмотрим на искусственную нейронную сеть.

В приведенной выше нейронной сети показаны четыре входа. На самом деле, количество входов может быть любым.

Показан один скрытый слой. Можно использовать любое количество скрытых слоев.

Кроме того, в скрытом слое всего четыре узла. На самом деле можно выбрать любое количество узлов.

Всегда только один выходной слой. Количество узлов будет равно количеству выходов.

В этом примере у нас есть четыре выхода (Y1, Y2, Y3 и Y4).

Теперь давайте рассмотрим пример с числами.

Предположим, мы планируем прогнозировать фондовый рынок.

Затем можно выбрать среднюю цену акции за день в качестве входных данных и предсказать среднюю цену акции на следующий день.

В этой ситуации есть только один вход и один выход.

X1 Y1

Входной слой Скрытый слой Выходной слой

Прошлая цена акции является входом. (Х1)

Только один (1) узел во входном слое.

Цена акции на следующий день является результатом. (Y1)

Только один (1) узел в выходном слое.

Можно использовать любое количество скрытых слоев.

В этом случае используется только один скрытый слой.

четыре узла используются в скрытом слое.

Математика нейронных сетей:

Давайте сделаем нейронную сеть, чтобы предсказать цену акций.

Входные данные (X1) = цена акции в прошлом.

Выход (Y1) = цена акции на следующий день

Поскольку есть только один вход, во входном слое есть только один узел.

Предположим, что в скрытом слое есть 2 узла.

Поскольку есть только один выход, предположим, что в выходном слое есть один узел.

X1 Y1

Введем веса. (Мы введем предвзятость позже)

W1. X1

X1 Y1

W2. X1

Пример:

Предположим, что цена акции в первый день (X1) = 23,9.

Назовем веса W1 и W2.

Предположим, что W1 = 0,5 и W2 = 0,7.

Возьмем сигмовидную функцию. F(x) = 1/(1 + e-x)

Решение:

X1 = 23.9; W1 = 0.5; W2 = 0.7

В этом примере я не использовал смещение, чтобы максимально упростить математику.

ШАГ 1: Найдите Σ (W1.X1 + W2.X1)

Σ (W1.X1 + W2.X1) = 0.5 x 23.9 + 0.7 x 23.9 = 28.68

ШАГ 2: Примените сигмовидную функцию;

F(x) = 1/(1 + e-x)

F (28.68) = 1/(1 + e-28.68) = 0.99998

ШАГ 3: Рассчитайте убыток

Убыток = фактическая дата следующего дня, используемая в целях обучения — число, полученное из нейронной сети.

ШАГ 4: Рассчитайте функцию потерь

Потери преобразуются с использованием функции потерь.

ШАГ 5. Обратное распространение и изменение весов и смещения.