Благодаря машинному обучению компьютеры теперь могут предсказывать погоду, определять результаты фондового рынка, понимать покупательские привычки, управлять роботами на фабрике и т. д. Они «обучаемы» для таких ситуаций. Такие компании, как Google, Amazon, Facebook, Netflix, LinkedIn, поддерживают все наиболее популярные сервисы, ориентированные на потребителя, с помощью машинного обучения. Но в основе всего этого обучения лежит так называемый алгоритм. Таким образом, алгоритм — это не полная компьютерная программа, а конечная последовательность шагов для решения одной проблемы. В алгоритме предпринимаются определенные шаги для достижения конкретной и единственной цели.

По сути, машинное обучение основано на пробах и ошибках. Программу, которая может помочь самоуправляемому автомобилю отличить пешехода от дерева или транспортного средства, можно не писать вручную, но можно создать алгоритм для программы, которая сможет решить эту задачу, используя данные. Также могут быть созданы алгоритмы, помогающие программам предсказывать путь урагана, диагностировать раннюю болезнь Альцгеймера, определять самых оплачиваемых и неоплачиваемых футбольных звезд в мире. Алгоритмы машинного обучения в основном позволяют программам делать прогнозы и получать лучшие результаты в этих прогнозах на основе опыта проб и ошибок с течением времени.

Существует четыре основных типа алгоритмов машинного обучения:

  • контролируемое обучение,
  • Неконтролируемое обучение,
  • полуконтролируемое обучение,
  • Обучение с подкреплением.

Предоставляется компьютерная программа, содержащая данные, помеченные как контролируемое обучение. Например, когда задача разделения изображений кошек и собак определяется с помощью алгоритма сортировки изображений, изображения с кошками будут иметь тег «кошка», а изображения с собаками — тег «собака». Это считается «обучающим» набором данных, и теги остаются на своих местах до тех пор, пока программа не сможет успешно отсортировать изображения с приемлемой скоростью. В конце процесса выбирается функция, которая лучше всего описывает входные данные и делает наилучшую оценку «y» (выход) для заданного «X» (вход). Алгоритмы обучения с учителем пытаются смоделировать отношения и зависимости между выходными данными целевого предсказания и входными свойствами таким образом, чтобы они могли прогнозировать выходные значения для новых данных на основе отношений, которые они узнали из предыдущих наборов данных.

  • Ближайший сосед,
  • Наивный Байес,
  • деревья решений,
  • Линейная регрессия,
  • Опорные векторные машины,
  • Искусственные нейронные сети.

алгоритмы, такие как основные типы алгоритмов обучения с учителем.

Неконтролируемое обучение не содержит тегов. Вместо этого программа вслепую ставит задачу разделить изображения кошек и собак на две группы, используя один из двух методов. В алгоритме кластеризации длина ноги, длина тела, глаза и т. д. Подобные объекты объединяются на основе таких свойств, как. Другой алгоритм называется ассоциацией, и правила создаются на основе сходств, обнаруженных программой. Другими словами, среди изображений определяется общий шаблон, и изображения соответствующим образом сортируются. Это семейство алгоритмов машинного обучения, которые в основном используются для обнаружения закономерностей и описательного моделирования.

  • K-средняя кластеризация,
  • Правила ассоциации.

алгоритмы, такие как алгоритмы обучения без учителя, являются основными.

Полууправляемое обучение — это парадигма обучения, связанная с изучением того, как естественные системы, такие как люди, учатся в присутствии как помеченных, так и непомеченных данных [1]. Только несколько картинок помечены в полуконтролируемом обучении. Затем компьютерная программа использует алгоритм, чтобы сделать наилучшее предположение о непомеченных изображениях, а затем данные возвращаются в программу в качестве обучающих данных. Затем представляется новый набор изображений с несколькими тегами. Программа представляет собой повторяющийся процесс, пока она не сможет различать собак и кошек с приемлемой скоростью. Обучение с полуучителем находится между двумя предыдущими. Нанесение этикеток требует больших затрат, поскольку во многих случаях для этого требуются специалисты. Таким образом, полупроверенные алгоритмы являются лучшими кандидатами для построения моделей, хотя большинство наблюдений присутствуют при отсутствии тегов, но в небольшом количестве. В этих методах используется идея о том, что, хотя принадлежность немаркированных данных к группе неизвестна, эти данные несут важную информацию о параметрах группы.

В усиленном обучении программа знает правила игры и то, как в нее играть, и выполняет шаги для завершения раунда. Шахматы могут быть примером такого алгоритма. Единственная информация, предоставленная программе, - выиграл ли он матч. Он продолжает повторять игру, отслеживая свои успешные ходы, пока, наконец, не выиграет матч. Он постоянно учится у окружающей среды итеративно. В процессе инструмент учится на своем опыте взаимодействия с окружающей средой, пока не исследует все возможные ситуации.

  • Временная разница (TD),
  • Q Обучение,
  • Алгоритмы Сарса.

являются основными усиленными алгоритмами обучения.

Я подробно остановлюсь на содержании этих типов обучения в следующих постах.

ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА

[1] Zhu, X., and Goldberg, A.B. (2009). Введение в полуконтролируемое обучение. Искусственный интеллект и машинное обучение, 130. doi: 10.2200/S00196ED1V01Y200906AIM006

[2] Саваш, С. (2019), Karotis Arter Intima Media Kalınlığının Derin Öğrenme ile Sınıflandırılması, Gazi Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Ana Bilim Dalı, Doktora Tezi, Ankara.