Мир движется вперед быстрыми темпами. Если вы занимаетесь технологиями, финансами или искусством, очень маловероятно, что вы не слышали термин «машинное обучение», о котором сейчас все говорят. Возьмите любой сектор, есть несколько рабочих приложений ML, которые мы можем указать и распознать. Поначалу это может показаться немного пугающим, но машинное обучение — одна из самых доступных и простых для понимания концепций в современном мире. Чтобы сделать его еще более ясным, вот краткое изложение основных ключевых терминов и понятий.

Формальное определение звучит так:

Говорят, что компьютерная программа учится на опыте E в отношении
некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеряемая P, улучшается с опытом E.

Давайте разобьем приведенное выше определение на части, сначала взглянув на пример.

Думайте о себе как о новорожденном ребенке. Вы только пришли в этот мир и не имеете никакого опыта. С чистого листа. Теперь горит свеча, и вы не можете не дотронуться до пламени. Вы обжигаетесь, это причиняет вам боль, и вы понимаете, что выполнение этой задачи не является чем-то благоприятным. В следующий раз, когда вы увидите пламя свечи, вы не подходите к нему из-за своего предыдущего неудачного опыта. Таким образом, ваша производительность при выполнении задачи, измеряемая показателем производительности, улучшилась по мере того, как вы сгорали. Таким образом, вы учитесь.

Точно такой же сценарий с компьютерами.

Машинное обучение бывает четырех основных типов.

  • Контролируемое машинное обучение
  • Неконтролируемое машинное обучение
  • Полууправляемое машинное обучение
  • Обучение с подкреплением

Контролируемое обучение

Компьютер, которому поручено классифицировать разные фрукты по разным классам на основе сходных характеристик, таких как цвет, форма и размер, может быть примером контролируемого обучения. У вас есть яблоки, бананы, вишни и клубника.

Бананы легко классифицировать из-за их отличительных особенностей, но когда дело доходит до яблок, вишни и клубники, есть несколько общих черт, таких как цвет и форма. Таким образом, выбор правильного признака для классификации является еще одним важным аспектом, который необходимо учитывать, и он повышает точность классификации. Здесь отличительной чертой является их размер относительно друг друга.

Здесь данные контролируются. Имеются метки, предназначенные для классификации выходных данных. В машинном обучении с учителем входные данные сопоставляются с соответствующими выходными данными.

Теперь, в зависимости от типа данных, которые у нас есть, есть еще два типа алгоритмов обучения с учителем, а именно классификация и регрессия. Если входные данные являются категориальными, мы идем на классификацию, а если они номинальные (числовые), мы идем на регрессию.

Примеры:

  • Обнаружение спама (классификация)
  • Линейная регрессия для прогнозирования цен на жилье (регрессия)

Обучение без учителя

Представьте, что вам не сказали, к каким классам относятся плоды из предыдущего примера. Метка не дается, и алгоритм группирует ее в группы, где он находит похожие свойства и шаблоны. Это неконтролируемое обучение.

Основная цель алгоритма обучения без учителя состоит в том, чтобы сгруппировать или классифицировать несортированный набор данных в соответствии со сходствами, закономерностями и различиями.

Существует два основных типа алгоритмов обучения без учителя: кластеризация, при которой мы находим присущие данные группы, и ассоциация, при которой мы измеряем интересность данных для их соответствующей группировки.

Примеры:

  • Алгоритм K-Means Clustering для обнаружения мошенничества с кредитными картами
  • Анализ рыночной корзины, чтобы найти товары, которые часто покупают вместе.

Полуконтролируемое обучение

Как контролируемое обучение, так и неконтролируемое обучение имеют свои недостатки. Чтобы преодолеть эти ограничения, были созданы полууправляемые алгоритмы для эффективного использования не только размеченных или неразмеченных данных, но и всех данных. Здесь часть данных помечается, и на основе этого автоматически обрабатываются и другие данные.

Пример

Подготовку к экзамену можно рассматривать как полуконтролируемый процесс. Сначала с помощью учителя вы выучили понятия. Но теперь, когда пришло время учиться самостоятельно, вы садитесь и изучаете их самостоятельно, без посторонней помощи.

Обучение с подкреплением

Это алгоритм обучения на основе обратной связи, в котором машина учится на основе положительной или отрицательной обратной связи. Чтобы понять эту концепцию, давайте подумаем о том, как дрессируется собака. Если собака выполняет трюки, которые мы ей приказываем, она получает угощение и вознаграждается, а если она не подчиняется, ее не вознаграждают. Так что он знает, как действовать, чтобы получить свою награду. Ребенок, тянущийся к пламени в первом примере, также является примером обучения с подкреплением, когда ребенок учится на своем негативном опыте и использует эту обратную связь для улучшения. Другой простой и известный пример — игровая среда.

Машинное обучение может быть увлекательной темой. Есть так много интересных алгоритмов и концепций, в которые нужно углубиться, и мы только поцарапали поверхность. Если вы заинтересованы в дальнейшем чтении, я бы посоветовал книгу Machine Learning, автором которой является Tom Mitchell, и курс Coursera под названием Machine. Обучение (предлагается Стэнфордским университетом), преподает Эндрю Нг.