Краткое и простое введение в машинное обучение для начинающих.

Как и живые существа, машины также могут учиться что-то делать. В этом случае машина — это ученик, а мир или другое существо — естественное или искусственное — учитель.

Согласно влиятельной книге Тома Митчелла 1997 года Машинное обучение, машинное обучение состоит из трех основных частей:

  • задание, которое нужно выучить.
  • наблюдения для изучения задачи.
  • насколько хорошо выполняется задание.

Задачи, которые необходимо изучить, включают предсказание знаний или действия. Насколько хорошо эти задачи выполняются, определяется точностью предсказанных знаний и наградами и наказаниями, вытекающими из действий.

По словам Митчелла, машинное обучение происходит, когда машина, будучи учеником, лучше справляется с задачей, наблюдая больше за миром.

Типы обучения

Учащийся может предсказывать новые знания, основываясь на том, что наблюдалось в мире. Это может включать в себя категоризацию или оценку вещей или понимание возможных хороших или плохих результатов действий.

Учимся предсказывать знания

Знания включают описание текущего состояния мира и предсказанные знания на основе состояния. Состояние может включать несколько частей информации. Например, укажите в электронном письме адрес электронной почты отправителя и текст электронного письма. Прогнозируемое знание будет включать в себя, является ли электронная почта спамом в зависимости от состояния.

Студенты могут прогнозировать знания на основе полных примеров, данных окружающим миром или учителем. Полными примерами являются те, которые включают предшествующие и последующие знания. Последующее знание следует за предшествующим знанием. Например, последующее знание текста электронной почты (предшествующее знание) может заключаться в том, что оно классифицируется как спам или не спам. Используя эти полные примеры, учащийся находит шаблоны или обобщенные отношения, называемые гипотезами, которые можно использовать для оценки будущих последующих знаний, используя только предшествующие знания. Эта форма обучения называется обучение с учителем.

Студент также может предсказывать знания без примеров, которые включают в себя последующие знания. В этом случае учащийся находит закономерности и общие черты в наблюдениях, которые можно использовать для оценки последующих знаний. Это называется неконтролируемым обучением. Например, учащийся может иметь группу фотографий объектов и сортировать группу по категориям отдельных типов объектов на основе общих характеристик  или состояния  на фотографиях. Но категории заранее неизвестны. Этот пример представляет собой случай обучения без учителя, называемого кластеризацией.

Учимся действовать

Студенты также могут действовать в зависимости от того, какие потенциальные награды или наказания могут быть получены. Задачи действия изучаются с помощью так называемого обучения с подкреплением. Это включает изучение желательности состояний (которые могут быть целями) и действий, которые могут привести к достижению состояний. Учащийся изучает политику  — действия, которые следует выполнять в определенных состояниях (т. е. в ситуациях).

Например, ученик может пройти лабиринт с наградой за достижение конца, а не с наказанием за нехватку времени. Учащийся действует, переходя из одной позиции в другую — из одного состояния в другое. Желаемая конечная цель или состояние — выйти из лабиринта и получить награду.

Учитель доставляет награды или наказания и может быть либо другим существом, либо самим внешним миром. Существа могут раздавать призы; внешний мир может раздавать наказания, такие как дождь или другие стихийные бедствия. Студенты учатся искать награды и избегать наказаний, независимо от их источника.

Рассуждение и структура знания

Эти три формы обучения строят более общие знания на конкретных примерах — форма индуктивного рассуждения. Обобщения хранятся в памяти и используются в новых ситуациях либо для предсказания новых знаний, либо для действия  — форма дедуктивного рассуждения. Они содержат две части знания: предшествующее и последующее. Например, политика обучения с подкреплением имеет антецедент в виде текущей ситуации и следствие в виде того, что делать.

Машинное обучение на практике: алгоритмы

Мы можем создавать обучающиеся машины, программируя их с помощью алгоритмов машинного обучения  — серии инструкций, которые принимают входные данные и производят выходные данные. Например, алгоритм контролируемого обучения принимает данные в качестве входных данных и выводит связь между предшествующими и последующими знаниями. Эти алгоритмы могут варьироваться от простых последовательностей инструкций до более сложных, которые даже имитируют работу мозга   и называются нейронными сетями.

Обучение как часть искусственного интеллекта

Чтобы эффективно функционировать, учащемуся необходимо сочетание обучения прогнозированию знаний и действия. Например, контролируемое обучение можно использовать для распознавания ситуаций  — называемых состояниями в искусственном интеллекте  — в шахматах, таких как «шах». Но обучение с подкреплением используется для определения наиболее эффективных действий в этом состоянии для получения вознаграждения — в данном случае — победы в игре.

Были созданы машины с искусственным интеллектом, чтобы справляться с этими формами обучения, но пока ни одна из них не может сравниться с человеческими способностями.