Новичок может получить обзор основных тем глубокого обучения.

Неудивительно, что в настоящее время появляется множество статей о глубоком обучении. Глубокое обучение, часть ИИ, сегодня используется для предоставления лучших решений в области распознавания изображений, речи и многого другого. Эта серия посвящена краткому введению в темы глубокого обучения в упорядоченном виде для новичков в этой области или для людей, которые находятся здесь только для того, чтобы понять основы глубокого обучения для твердого понимания основных основополагающих принципов.

Прежде чем начать, нам сначала нужно понять нейронные сети. Нейронные сети, основанные на функционировании биологических нейронов человека, являются одной из самых удивительных парадигм программирования, когда-либо созданных. В отличие от традиционных методов программирования, где мы использовали для определения статических решений проблем и передачи их в компьютер, нейронные сети просматривают данные, изучают и находят решение самостоятельно. Звучит круто!

Но до недавнего времени мы не знали, как обучать нейронные сети эффективному пониманию проблем. С 2006 года был открыт ряд методов эффективного обучения в этих глубоких нейронных сетях. Эти методы в совокупности определяют глубокое обучение. В настоящее время Deep Learning способно решать все основные проблемы в распознавании изображений, распознавании речи, обработке текста и многом другом и широко используется такими компаниями, как Google, Facebook и Microsoft.

Биологический нейрон

Давайте начнем с понимания биологического нейрона, который выглядит примерно так.

дендрит нейрона получает сигнал от других нейронов через синапс - точку взаимодействия между двумя нейронами. Сома обрабатывает информацию, а аксон передает выходные данные нейрона.

Наши органы чувств дают сигнал нейронам, и создается соответствующий ответ. Например, когда вы касаетесь чего-то очень горячего, эта информация передается в огромную параллельную сеть взаимосвязанных нейронов, и генерируется ответ, который убирает вашу руку.

Вдохновленный им, был создан искусственный нейрон, который является наиболее фундаментальной единицей глубокой нейронной сети. Искусственные нейроны, как и биологические нейроны, тоже принимают входные данные, обрабатывают их и выдают выходной сигнал.

McCulloch Pitts Neuron

В 1943 году Маккалок (нейробиолог) и Питтс (логик) предложили очень простую вычислительную модель нейрона.

Здесь g объединяет все входные данные. Сообщение, что f дает результат, основанный на решении.

Если сумма всех входов (выполненных g) пересекает порог, f показывает 1, в противном случае выдает 0. Этот нейрон можно использовать для представления логических функций, которые линейно разделяются.

Перцептрон

Предложенный Фрэнком Розенблаттом, американским психологом в 1958 году, перцептрон увидел введение весов, а также способ их узнавать. Входные данные могут быть реальными значениями, а порог может быть изучен вместо того, чтобы кодироваться вручную, в отличие от McCulloch Pitts Neuron.

Вычисление очень похоже на вычисление нейрона Мак-Каллока-Питтса, с тем изменением, что теперь веса также умножаются на соответствующие входные данные для определения выходных данных.

Персептроны позволяют придавать различное значение входам в соответствии с вашими потребностями, изменяя значение весов, связанных с этим входом.

Давайте разберемся на примере: вы хотите пойти в кино и используете перцептрон для принятия решения. У вас есть 3 основных вопроса, которые нужно задать себе -

  1. Есть ли у фильма рейтинг выше 8/10.
  2. Погода хорошая?
  3. Кинотеатр далеко.

Пусть эти 3 будут исходными данными для принятия вами решения. Вы можете установить x1 = 1, если рейтинг фильма выше 8, x2 = 0, если погода плохая, и x3 = 1, если кинотеатр далеко.

Теперь предположим, что вы цените хорошую работу, поэтому, независимо от погоды или расстояния, вы бы посмотрели фильм, если он получил очень высокую оценку. Таким образом, вы устанавливаете w1 выше, чем другие, скажем, w1 = 6. Установите более низкие значения для остальных, скажем, w2 = 3 и w3 = 2. Теперь выберите порог, скажем 3. Теперь, если фильм имеет высокий рейтинг, x1 * w1 = 6 Это значит, что даже если погода плохая и театр далеко, вы все равно пойдете смотреть фильм.

Теперь рассмотрим случай, когда у фильма невысокий рейтинг, т.е. x1 = 0. Теперь все зависит от погоды и расстояния. Если погода плохая, x2 = 0, и тогда, даже если театр рядом, с порогом 3, перцептрон попросит вас не идти. Но если порог будет равен 1, перцептрон порекомендует вам уйти.

Это показывает, что, варьируя веса и пороговые значения, вы можете соответственно создать систему принятия решений. Существуют способы, с помощью которых перцептрон может сам определять наилучшие веса и пороговые значения в соответствии с вашими потребностями (например, путем обучения на основе прошлых данных).

Сеть перцептронов способна решать ЛЮБУЮ логическую функцию.

Спасибо за чтение!

Если вы хотите больше разобраться в таких основных темах, не стесняйтесь подписываться на них и оставаться в курсе.