Мир движется вперед быстрыми темпами. Если вы занимаетесь технологиями, финансами или искусством, очень маловероятно, что вы не слышали термин «машинное обучение», о котором сейчас все говорят. Возьмите любой сектор, есть несколько рабочих приложений ML, которые мы можем указать и распознать. Поначалу это может показаться немного пугающим, но машинное обучение — одна из самых доступных и простых для понимания концепций в современном мире. Чтобы сделать его еще более ясным, вот краткое изложение основных ключевых терминов и понятий.
Формальное определение звучит так:
Говорят, что компьютерная программа учится на опыте E в отношении
некоторого класса задач T и показателя производительности P, если ее производительность при выполнении задач в T, измеряемая P, улучшается с опытом E.
Давайте разобьем приведенное выше определение на части, сначала взглянув на пример.
Думайте о себе как о новорожденном ребенке. Вы только пришли в этот мир и не имеете никакого опыта. С чистого листа. Теперь горит свеча, и вы не можете не дотронуться до пламени. Вы обжигаетесь, это причиняет вам боль, и вы понимаете, что выполнение этой задачи не является чем-то благоприятным. В следующий раз, когда вы увидите пламя свечи, вы не подходите к нему из-за своего предыдущего неудачного опыта. Таким образом, ваша производительность при выполнении задачи, измеряемая показателем производительности, улучшилась по мере того, как вы сгорали. Таким образом, вы учитесь.
Точно такой же сценарий с компьютерами.
Машинное обучение бывает четырех основных типов.
- Контролируемое машинное обучение
- Неконтролируемое машинное обучение
- Полууправляемое машинное обучение
- Обучение с подкреплением
Контролируемое обучение
Компьютер, которому поручено классифицировать разные фрукты по разным классам на основе сходных характеристик, таких как цвет, форма и размер, может быть примером контролируемого обучения. У вас есть яблоки, бананы, вишни и клубника.
Бананы легко классифицировать из-за их отличительных особенностей, но когда дело доходит до яблок, вишни и клубники, есть несколько общих черт, таких как цвет и форма. Таким образом, выбор правильного признака для классификации является еще одним важным аспектом, который необходимо учитывать, и он повышает точность классификации. Здесь отличительной чертой является их размер относительно друг друга.
Здесь данные контролируются. Имеются метки, предназначенные для классификации выходных данных. В машинном обучении с учителем входные данные сопоставляются с соответствующими выходными данными.
Теперь, в зависимости от типа данных, которые у нас есть, есть еще два типа алгоритмов обучения с учителем, а именно классификация и регрессия. Если входные данные являются категориальными, мы идем на классификацию, а если они номинальные (числовые), мы идем на регрессию.
Примеры:
- Обнаружение спама (классификация)
- Линейная регрессия для прогнозирования цен на жилье (регрессия)
Обучение без учителя
Представьте, что вам не сказали, к каким классам относятся плоды из предыдущего примера. Метка не дается, и алгоритм группирует ее в группы, где он находит похожие свойства и шаблоны. Это неконтролируемое обучение.
Основная цель алгоритма обучения без учителя состоит в том, чтобы сгруппировать или классифицировать несортированный набор данных в соответствии со сходствами, закономерностями и различиями.
Существует два основных типа алгоритмов обучения без учителя: кластеризация, при которой мы находим присущие данные группы, и ассоциация, при которой мы измеряем интересность данных для их соответствующей группировки.
Примеры:
- Алгоритм K-Means Clustering для обнаружения мошенничества с кредитными картами
- Анализ рыночной корзины, чтобы найти товары, которые часто покупают вместе.
Полуконтролируемое обучение
Как контролируемое обучение, так и неконтролируемое обучение имеют свои недостатки. Чтобы преодолеть эти ограничения, были созданы полууправляемые алгоритмы для эффективного использования не только размеченных или неразмеченных данных, но и всех данных. Здесь часть данных помечается, и на основе этого автоматически обрабатываются и другие данные.
Пример
Подготовку к экзамену можно рассматривать как полуконтролируемый процесс. Сначала с помощью учителя вы выучили понятия. Но теперь, когда пришло время учиться самостоятельно, вы садитесь и изучаете их самостоятельно, без посторонней помощи.
Обучение с подкреплением
Это алгоритм обучения на основе обратной связи, в котором машина учится на основе положительной или отрицательной обратной связи. Чтобы понять эту концепцию, давайте подумаем о том, как дрессируется собака. Если собака выполняет трюки, которые мы ей приказываем, она получает угощение и вознаграждается, а если она не подчиняется, ее не вознаграждают. Так что он знает, как действовать, чтобы получить свою награду. Ребенок, тянущийся к пламени в первом примере, также является примером обучения с подкреплением, когда ребенок учится на своем негативном опыте и использует эту обратную связь для улучшения. Другой простой и известный пример — игровая среда.
Машинное обучение может быть увлекательной темой. Есть так много интересных алгоритмов и концепций, в которые нужно углубиться, и мы только поцарапали поверхность. Если вы заинтересованы в дальнейшем чтении, я бы посоветовал книгу Machine Learning, автором которой является Tom Mitchell, и курс Coursera под названием Machine. Обучение (предлагается Стэнфордским университетом), преподает Эндрю Нг.