Экспертные системы

Как люди, в нашем сознании есть сложный набор правил, на основе которых принимается каждое отдельное решение. Эти решения подвержены влиянию факторов, которые необходимо учитывать, чтобы обеспечить положительный результат. Таким образом, если машина должна быть наделена этой интеллектуальной способностью, у нас есть две альтернативы.

  1. Предоставьте сложный набор правил в виде кода. (Не оптимально)
  2. Используйте машинное обучение. (Ах, да!)

Мы сами не понимаем ход наших мыслей, поэтому можно с уверенностью предположить невероятную перспективу создания искусственного мозга путем кодирования правил принятия решений в программе. Поэтому мы переходим на альтернативный путь машинного обучения.

Банки машинного обучения

Банки? Это потому, что все любят джем, что сокращенно от жаргона. Эти jar-файлы представляют собой 6 основных компонентов, необходимых для успешной реализации машинного обучения.

Данные

С точки зрения высокого уровня алгоритм машинного обучения можно рассматривать как функцию, которая принимает «X» и выдает «Y».

«X» - это упорядоченный набор числовых значений. Поскольку машинное обучение уходит корнями в математику и алгебру, оно работает только с числами. Каждое числовое значение является количественным представлением атрибута / функции. Алгоритмы машинного обучения учитывают эти атрибуты для определения правильного результата.

Обычно данные также включают соответствующий результат, ожидаемый от алгоритма, которым является «Y». Такой набор данных называется данными с метками.

Задача

Задача - это цель, которую стремится достичь алгоритм машинного обучения. Их можно в целом разделить на классификацию, регрессию и генерацию.

Пример классификации

Это собака или кошка? Задача состоит в том, чтобы определить, является ли предоставленное изображение изображением собаки или кошки. Классификация изображений обычно выполняется с помощью Сверточных нейронных сетей.

Пример регрессии

Прогноз цен на дом. Задача состоит в том, чтобы спрогнозировать цену дома с учетом его характеристик и характеристик, таких как местоположение, площадь, количество комнат и т. д.

Пример генерации

Создание фальшивых картин Пикассо. Да, верно! Мы действительно можем создавать произведения искусства, имитирующие стиль Пикассо. Для этого используются Генеративные состязательные нейронные сети.

Модель

Модели представляют собой алгоритмы машинного обучения, которые можно использовать для успешного выполнения выбранной задачи. Существует множество моделей, из которых можно выбирать, и выбор делается с использованием компромисса смещения и дисперсии. Смещение представляет собой неспособность модели успешно адаптироваться к данным, а дисперсия представляет собой изменение результата, когда модель применяется к невидимым данным. Оба они пагубно влияют на поставленную задачу.

Смещение и дисперсия связаны друг с другом обратной пропорциональностью, известной как компромисс смещения-дисперсии. Таким образом, оптимальная модель, которую мы выбираем, должна находиться в зоне наилучшего восприятия, где смещение и дисперсия невелики.

Примеры простых моделей в регрессии с возрастающей сложностью:

Y = AX + C {прямая линия}

Y = AX² + BX + C {парабола}

Y = AX²³ + BX²² +… + Z {волнистый .. очень волнистый}

Потеря

Y = AX² + BX + C

Характеристики модели характеризуются параметрами, связанными с ней. Например, коэффициенты A, B и константа C являются параметрами указанной выше модели и могут принимать любое числовое значение. Чтобы определить оптимальные параметры модели, мы должны определить количественный показатель соответствия модели данным. Это требует функции потерь.

Самая распространенная функция потерь - это сумма квадратов ошибок (SSE), которая представляет собой квадрат разницы между ожидаемым и наблюдаемым результатом.

Обучение

Оптимальные параметры модели определяются с помощью алгоритма обучения. Для машины чрезвычайно утомительно вычислять оптимальные параметры модели с использованием грубой силы, поэтому для эффективного вычисления этих параметров были разработаны несколько алгоритмов обучения с корнями в исчислении.

Некоторые из них - градиентный спуск, обратное распространение (BP) в нейронных сетях с прямой связью и обратное распространение во времени (BPTT) в рекуррентных нейронных сетях.

Оценка

Обычно данные, которые мы используем для машинного обучения, неполны и являются выборкой из огромной совокупности. Существует вероятность того, что модель, которую мы обучаем, вписывается в данные до нежелательной степени, то есть она изучает правила, специфичные для выборки, а не для всей генеральной совокупности, это называется чрезмерной подгонкой.

Мы не хотим, чтобы наша модель была специфичной для обучающих данных. Общность важна, если модель должна оптимально работать с оставшимися данными по совокупности и, таким образом, повышает требования к оценке моделей.

Некоторые популярные методы оценки моделей - это перекрестная проверка и метод удержания. В случае классификации у нас есть дополнительные критерии оценки, называемые Точность и отзыв.

Сообщение Word

Спасибо за прочтение! Написание этого блога помогло мне консолидировать свои идеи и понять уникальную модель 6 Jars, описанную в курсе глубокого обучения PadhAI by One Fourth Labs, и я надеюсь, что это было приятное чтение, которое подчеркивает суть машинного обучения. Что вы думаете об этих 6 банках? Дай мне знать в комментариях :)