Машинное обучение чрезвычайно популярно в наши дни, влияя на то, какой контент мы видим, какие продукты мы покупаем, кому будет выдана ипотека, а кому нет. Но как это работает?

К концу статьи вы поймете, как такая машина, как компьютер, может обучаться. Цель этой статьи - развить интуицию во внутреннем устройстве машинного обучения. Не фокусируясь на каком-то конкретном алгоритме, а на интуиции, стоящей за ними.

Машинное обучение и Искусственный интеллект решают множество проблем. Здесь я остановлюсь на одной из самых распространенных и популярных проблем. Классификация.

Классификация - это задача:
Предсказать правильный класс по набору данных. Получение информации, которую мы должны предсказать, чего у нас нет.
Например. В банке человек подает заявку на ипотеку. Мы знаем историю работы человека, историю транзакций, возраст, сумму займа и цену дома. Банк хочет знать, будет ли одобрение этой ипотеки хорошей или плохой инвестицией. В этом случае класс, который нужно предсказать, - это «хорошие инвестиции» или «плохие инвестиции».

Классификация позволяет нам абстрагироваться, группировать и принимать лучшие решения о мире.

Итак, как машины могут научиться классифицировать?
Они учатся на собственном примере.
Чтобы научить машину, мы показываем им примеры, на которых можно учиться. Мы не говорим им, что делать. Мы показываем им примеры хороших и плохих вложений в прошлом и позволяем им учиться у них. Мы называем это обучающими данными.

Итак, машина учится на примере. Но как он учится?
Здесь все немного по-другому. Но есть два основных подхода:

- Узнайте границы принятия решения.
- Узнайте, где в мире находится образец для прогнозирования падений?

Граница решения - это линия, которая наилучшим образом разделяет приведенные нами примеры на классы, которые нам нужны. В какой-то момент нам нужно принять решение.
Чтобы создать правило или набор правил, разделяющих два класса. Это граница принятия решения.

Простым примером может быть, если мы пытаемся классифицировать здания по классам небоскреб / не небоскреб. Современное определение таково, что здания выше 150 метров - это небоскребы. Но, допустим, мы этого не знали. Вместо этого у нас был набор примеров небоскребов и не небоскребов.
Итак, если мы дадим машине набор примеров зданий с их высотой и классом, она попытается найти линию, которая лучше всего разделяет здания.

Это был очень простой пример, граница решения может быть намного сложнее.

Способ, которым машина находит эту линию, будет зависеть от конкретного алгоритма машинного обучения. Методом проб и ошибок, деревьями решений, опорными векторами, дифференцированием и т. Д. Но принцип тот же. Найдите линию, которая точнее разделяет классы.

Другой подход - найти где в мире находится образец для предсказания падений. мир, означающий пространство, представленное входными переменными обучающих данных (что мы знаем) . В этом случае машина ищет похожие примеры.

Вещи имеют тенденцию быть похожими на них. Если он ходит как утка и крякает как утка. Скорее всего, это утка.

Если бы у нас были все возможные примеры для каждой возможной переменной. И мы хотели предсказать класс для данной выборки.
Нам просто нужно было посмотреть, к какому классу относится выборка с этими значениями. Но мы редко знаем каждый образец в мире.

Итак, мы используем подходы, которые приблизительно соответствуют этому. Мы можем посмотреть на соседей и на основе них предсказать наиболее вероятный класс.
Мы видим, что большинство соседей относятся к классу A, поэтому вполне вероятно, что образец, который мы хотим знать, также принадлежит классу A.

Другой подход включает изучение распределения вероятностей для каждого класса для каждой входной переменной. И оттуда вычислите наиболее вероятный класс выборки для прогнозирования.

По сути, чтобы узнать, насколько вероятно, что образцы с определенными значениями принадлежат определенному классу.

В обоих примерах построена приблизительная модель мира, а затем дан ответ на вопрос. Где в мире находится этот новый образец?

Представленные здесь примеры намеренно упрощены, чтобы развить у них интуицию. Работает только с одной или двумя переменными.
В реальном мире машинное обучение может использовать вычислительную мощность для изучения миллионов обучающих выборок со сложными отношениями между многочисленными переменными и многочисленными классами.
Машинное обучение позволяет делать прогнозы намного быстрее, чем любой человек. А в некоторых случаях точнее.

Это то, что дает ML его силу.

Было бы непрактично поручить человеку выбирать, какие видео на YouTube могут вас заинтересовать. Но машина? Нет проблем.
Какой класс товаров может вас заинтересовать? Просто отправьте некоторую информацию о профиле и получите лучшие классы.
Предсказать цену дома на основе размера, возраста, количества ванных комнат, местоположения и аналогичных данных по предыдущим продажам дома? Ага, машинное обучение.

Машинное обучение дает множество приложений и преимуществ. Некоторые предупреждающие знаки тоже. Но это очень мощная технология, и она никуда не денется.

Я надеюсь, что эта статья помогла вам развить интуицию в том, как машины учатся. Это не волшебство. Некоторые логические принципы, данные и умная математика для поиска решения.
С помощью машинного обучения можно решать сложные проблемы, в которых мы не знаем основополагающих отношений и правил. И это позволяет нам принимать более правильные решения в отношении мира.

  • Машины учатся на примере.
  • Мы используем известные нам данные, чтобы находить то, чего не знаем
  • В какой-то момент нам нужно принять решение. Машины могут учиться, узнавая, где находится граница принятия решения.
  • Вещи обычно похожи на них. Машины могут учиться, изучая модель мира и проверяя, где находится образец в мире.