Эта статья написана для того, чтобы бабушка могла понять, что такое машинное обучение и глубокое обучение.

Что такое машинное обучение?

Это отрасль искусственного интеллекта, которая начала приобретать значение с 80-х годов. Это тип ИИ, который больше не зависит от правил и программиста, но компьютер может устанавливать свои собственные правила и учиться сам по себе.
Машинное обучение происходит с помощью алгоритмов. Алгоритм — это не что иное, как последовательность упорядоченных шагов, которые выполняются для выполнения задачи.
Цель машинного обучения — создать модель, позволяющую решить поставленную задачу. Затем модель обучается на большом количестве данных. Модель учится на этих данных и может делать прогнозы. В зависимости от задачи, которую вы хотите выполнить, целесообразнее будет работать с тем или иным алгоритмом.

Что такое искусственный интеллект?

Искусственная интеллигеника — это способность компьютера самостоятельно обучаться решению конкретной задачи. Например, всякий раз, когда вы берете трубку в 7 утра, вы открываете приложение FM-радио. Представьте себе, что сотовый телефон может сам включать радио каждый день в одно и то же время, и вам не нужно это делать?

Это искусственный интеллект.

Но на этом все не заканчивается, в искусственном интеллекте есть много разных областей, где, в зависимости от того, какие инструкции даны компьютеру, он будет реагировать. В художественном интеллекте есть три разных способа обучения компьютера с помощью данных:

Контролируемое обучение:

«При обучении с учителем алгоритмы работают с «помеченными» данными, пытаясь найти функцию, которая, учитывая входные переменные, дает им соответствующий выходной тег. Алгоритм обучается на «исторических» данных и, таким образом, «научится» назначать соответствующую выходную метку новому значению, то есть прогнозировать выходное значение. (Симеоне, 2018)»

Неконтролируемое обучение

«Неконтролируемое обучение имеет место, когда нет «размеченных» данных для обучения. Нам известны только входные данные, но нет выходных данных, соответствующих заданным входным данным. Поэтому мы можем только описать структуру данных, попытаться найти какую-то организацию, упрощающую анализ. Поэтому они являются исследовательскими. “

Усиленное обучение

«Этот тип обучения основан на улучшении отклика модели с помощью процесса обратной связи. Алгоритм учится, наблюдая за окружающим миром. Его входной информацией является обратная связь или обратная связь, которую он получает от внешнего мира в ответ на свои действия. поэтому система учится методом проб и ошибок. “

Например, есть машинное обучение или контролируемый k-ближайший сосед:
это модель распознавания фигур, которую можно использовать для классификации и получения графических данных на различных объектов.
Представьте, что у нас есть следующие цифры для классификации с помощью этого типа обучения:

Когда в пустое место добавляются новые фигуры, желательно, чтобы компьютер с контролируемым обучением идентифицировал новую фигуру и сохранял ее в другом месте, не удаляя ее оттуда, где она появилась:

если мы скажем компьютеру, например, что у него есть буква, равная 3, машина найдет три ближайших цифры новой цифры, чтобы классифицировать их в соответствии с формой наибольшего количества цифр, которые она найдет.
В На следующем рисунке три фигуры, наиболее близкие к новой фигуре, то есть зеленому сердцу, - это дианамте и две звезды:

Среди простейших форм контролируемого обучения метод k-ближайших соседей считается типом отложенного обучения, поскольку обобщение за пределами обучающих данных не происходит до тех пор, пока не будет сделан системный запрос. .

Другой метод контролируемого обучения — Обучение дерева решений:

В общих целях этот метод используется для визуального представления решений и демонстрации или информирования о принятии решений.
Целью изучения дерева решений является создание модели, которая прогнозирует значение цели на основе входных данных.
При «изучении» дерева исходные данные делятся на подмножества на основе проверки значения атрибута, которая рекурсивно повторяется в каждом из производных подмножеств. Как только подмножество в узле будет иметь значение, эквивалентное целевому значению, процесс рекурсии будет завершен.

Давайте рассмотрим пример нескольких условий, которые могут определить, следует ли кому-то идти на рыбалку или нет. Это включает в себя погодные условия, а также условия барометрического давления.

В приведенном выше упрощенном дереве решений пример классифицируется путем его классификации по дереву до соответствующего конечного узла. Это возвращает классификацию, связанную с конкретным листом, который в данном случае представляет собой пластырь на нет. Дерево классифицирует условия дня в зависимости от того, подходит ли оно для рыбалки или нет.

Следующая модель обучения — глубокое обучение:

Глубокое обучение пытается имитировать способности вашего мозга при реагировании на чувства. Бабушка, например, представьте, что согласие на получаемый им свет, влажность земли и положение, в котором находятся ваши растения, могут быть вылиты правильно. воды в точное время суток? и что все контролировалось с помощью компьютера, настроенного на понимание того, что это за момент? Это было бы здорово. Ну, это глубокое обучение.

Теперь… как настроить компьютер и как заставить компьютер выполнять такие задачи?

Нейронные сети и глубокое обучение в настоящее время обеспечивают лучшие решения многих проблем распознавания изображений, распознавания голоса и обработки естественного языка.

Это делается с помощью языков программирования:

Это формальный язык, который дает человеку возможность написать серию инструкций или последовательностей заказов в виде алгоритмов, чтобы контролировать физическое или логическое поведение компьютера.

Что такое алгоритмы?:

Это последовательность инструкций, которые представляют собой модель решения для определенных типов проблем или набор инструкций, которые выполняются для получения решения проблемы.

Для программирования искусственного интеллекта наиболее часто используемым языком программирования является Python. Его можно охарактеризовать как язык программирования с открытым исходным кодом, ориентированный на простые в освоении объекты, поскольку он удобен для чтения, мощен и удобен как для предварительной обработки данных, так и для непосредственной работы с данными.

Но тишина, для работы с машинным обучением с Python есть инструменты, совместимые с Python, такие как TensorFlow, PyTorch, Keras. Наиболее часто используется Tensorflow.

Поскольку машинное обучение используется для обработки больших объемов данных или информации, его наиболее широкое применение находится в центрах финансовых услуг, таких как банки и другие промышленные компании, государственных учреждениях, таких как службы общественной безопасности и коммунальные услуги. , веб-сайты, которые рекомендуют статьи, которые могут вас заинтересовать, на основе предыдущих покупок, сделанных вами в Интернете, среди многих других приложений.

Одно из самых сильных направлений машинного обучения — глубокое обучение.

Глубокое обучение или Deep Learning является частью более широкого семейства методов машинного обучения, основанных на искусственных нейронных сетях. Обучение может быть контролируемым, полуконтролируемым или неконтролируемым.

Архитектуры глубокого обучения, такие как глубокие нейронные сети, рекуррентные нейронные сети и сверточные нейронные сети, применялись в таких областях, как компьютерное зрение, распознавание речи, обработка естественного языка, распознавание звука, фильтрация социальных сетей, автоматический перевод, биоинформатика, разработка лекарств, медицинские изображения. программы анализа, проверки материалов и настольных игр, в которых были получены сравнимые результаты, а в некоторых случаях превосходящие результаты экспертов в области человека

Глубокое обучение или Deep Learning является частью более широкого семейства методов машинного обучения, основанных на искусственных нейронных сетях. Обучение может быть контролируемым, полуконтролируемым или неконтролируемым.
Искусственные нейронные сети (РНК) были вдохновлены узлами обработки информации и распределенной связи биологических систем. РНК имеют несколько отличий по отношению к биологическому мозгу. В частности, нейронные сети, как правило, статичны и символичны, в то время как биологический мозг большинства живых организмов динамичен (пластичен) и аналогов.

Что такое глубокое обучение?

Как я объяснял ранее в трех направлениях машинного обучения, глубокое обучение — это класс алгоритмов машинного обучения, который использует несколько слоев нейронных сетей для постепенного извлечения функций более высокого уровня из входных данных.

Все звучит слишком интересно, верно? Итак, что мне нужно, чтобы начать работать с машинным обучением и всеми его производными?

Главное, чтобы было ясно, что вы должны знать о статистике, вероятностях, информатике и математике, в общей линейной алгебре. Несмотря на огромные возможности машинного и глубокого обучения, для полного понимания внутреннего функционирования алгоритмов и получения хороших результатов необходимо глубокое математическое понимание многих из этих методов.

Зачем беспокоиться о математике?

Есть много причин, почему математика машинного обучения важна, и я выделю некоторые из них ниже:

  1. Выбор правильного алгоритма, который включает в себя рассмотрение точности, времени обучения, сложности модели, количества параметров и количества функций.
  2. Выбор настроек параметров и стратегий проверки.
  3. Выявление недообучения и переобучения путем понимания компромисса смещения и дисперсии.
  4. Оценка правильного доверительного интервала и неопределенности.

Какой уровень математики мне нужен?

Этот график мог бы более четко объяснить, какой уровень у вас должен быть, если вы хотите работать с машинным обучением:

  1. Линейная алгебра: Коллега, Skyler Speakman, недавно сказал, что Линейная алгебра — это математика 21 века, и я полностью согласен с этим утверждением. В машинном обучении линейная алгебра встречается повсюду. Такие темы, как анализ основных компонентов (PCA), разложение по сингулярным числам (SVD), собственное разложение матрицы, LU-разложение, QR-разложение/факторизация, симметричные матрицы, ортогонализация и ортонормализация, матричные операции, проекции, собственные значения и собственные векторы, векторные пространства и нормы. необходимы для понимания методов оптимизации, используемых для машинного обучения. Самое удивительное в линейной алгебре то, что существует так много онлайн-ресурсов. Я всегда говорил, что традиционный класс умирает из-за огромного количества ресурсов, доступных в Интернете. Мой любимый курс по линейной алгебре — это курс, предлагаемый MIT Courseware (проф. Гилберт Стрэнг).

2. Теория вероятностей и статистика. Машинное обучение и статистика не очень разные области. На самом деле, кто-то недавно определил машинное обучение как «ведение статистики на Mac». Некоторые из фундаментальных статистических и вероятностных теорий, необходимых для машинного обучения, включают комбинаторику, правила и аксиомы вероятностей, теорему Байеса, случайные величины, дисперсию и ожидание, условное и совместное распределения, стандартные распределения (бернуллиевское, биномиальное, полиномиальное, равномерное и гауссовское), момент Генерирующие функции, оценка максимального правдоподобия (MLE), априорная и апостериорная оценка, максимальная апостериорная оценка (MAP) и методы выборки.

3. Многомерное исчисление: некоторые из необходимых тем включают дифференциальное и интегральное исчисление, частные производные, векторно-значные функции, направленный градиент, гессианское, якобианское, лапласианское и лагражское распределение.

4. Алгоритмы и комплексная оптимизация. Это важно для понимания вычислительной эффективности и масштабируемости нашего алгоритма машинного обучения, а также для использования разреженности в наших наборах данных. Требуется знание структур данных (бинарные деревья, хэширование, куча, стек и т. д.), динамического программирования, рандомизированных и сублинейных алгоритмов, графиков, градиентных/стохастических спусков и первично-двойственных методов.

5. Прочее: Сюда входят другие математические темы, не охваченные в четырех основных областях, описанных выше. Они включают реальный и комплексный анализ (множества и последовательности, топология, метрические пространства, однозначные и непрерывные функции, пределы, ядро ​​​​Коши, преобразования Фурье), теорию информации (энтропия, прирост информации), функциональные пространства и многообразия.

Надеюсь, вам будет интересно узнать об этом чудесном мире бабушек.

вебграфия:

Введение в машинное обучение

Шпаргалка по алгоритму машинного обучения

Разница между искусственным интеллектом, машинным обучением и глубоким обучением