Машинное обучение стало проще: что это такое и как работает

«Люди опасаются, что компьютеры станут слишком умными и захватят мир, но настоящая проблема в том, что они слишком глупы и уже захватили мир».

- Педро Доминго

МАШИННОЕ ОБУЧЕНИЕ - это процесс, с помощью которого машина чему-то учится. Конец.

Только пошутил. Мы собираемся копнуть немного глубже, но это действительно показывает, насколько простыми могут быть базовые концепции машинного обучения. В этой статье мы собираемся сделать машинное обучение настолько простым, чтобы это мог сделать ребенок. Вот почему мы собираемся использовать LEGO.

Наш пример машинного обучения собирает информацию о каждом из кубиков LEGO, включая цвет, размер и площадь поверхности. Сохраняя информацию о каждом из этих блоков в базе данных алгоритма, он может начать предсказывать, какие части вам могут понадобиться в следующий раз. Фактически, он может начать анализировать все возможные комбинации частей и определять формы, которые вы, возможно, пытаетесь построить. Думайте об этом как об автозаполнении Google, но с LEGO.

Машинное обучение работает, определяя, как лучше всего разделить разные точки данных. Например, если стопка блоков выше представляет собой необработанные данные, алгоритм может отсортировать данные следующим образом:

Чтобы алгоритм машинного обучения обрабатывал данные, ему требуется так называемая целевая функция, которая в основном определяет правила и функциональные возможности, которые использует алгоритм. В машинном обучении мы склонны использовать функцию потерь, что в основном означает, что алгоритм получает штрафы, когда он делает ошибки. Итак, цель - сделать как можно меньше ошибок.

Алгоритмам машинного обучения в основном предлагается выяснить, как лучше всего расположить свои блоки LEGO, при этом набирая как можно меньше штрафов. И точно так же, как существует более одного способа сортировки смешанного набора блоков LEGO, существует более одного способа создания алгоритма, от деревьев решений до нейронных сетей. Хитрость заключается в том, чтобы найти наилучшее возможное решение для выполнения работы.

Некоторые алгоритмы машинного обучения более гибкие, чем другие, но эта гибкость обычно сопровождается некоторыми другими затратами, такими как количество ресурсов, необходимых для запуска алгоритма. Вдобавок ко всему, большинство разработчиков будут запускать разные итерации разных алгоритмов, чтобы увидеть, какой из них дает наилучшие результаты.

Мы обычно называем эти разные итерации «моделями», и со временем мы используем именно эти модели. С нашими блоками LEGO модель сможет классифицировать новые блоки по мере их добавления, а не только блоки, которые были изначально заданы. На самом деле настоящая сила машинного обучения заключается в том, что чем больше оно используется и чем больше данных обрабатывает, тем лучше оно становится.

Создание алгоритма машинного обучения не слишком отличается от обычного программирования, потому что оба требуют участия человека. Разница в том, что обычному программисту придется задуматься над задачей LEGO и разработать набор правил, которым машина будет слепо следовать. Программист машинного обучения в значительной степени устанавливает параметры, предоставляет входные данные и оставляет машину, чтобы определить само решение.

В подавляющем большинстве случаев самой большой проблемой для этих алгоритмов является их способность понимать данные, особенно когда они поступают из разрозненных источников. В сфере здравоохранения, например, машинное обучение сдерживается отсутствием совместимых наборов данных и отсутствующими или неверными точками данных, которые отправляют его в неправильном направлении.

Это плохие новости, но хорошие новости заключаются в том, что мы все еще находимся на первых этапах развития машинного обучения, и потенциальные приложения в области здравоохранения делают его одной из самых захватывающих технологий на планете. Теперь вы знаете, как это работает, и можете объяснить это 10-летнему ребенку. Это хорошо, потому что именно 10-летние дети сегодня будут создавать системы машинного обучения, которые станут двигателем будущего. Давай.

Хотите узнать больше?

Я больше говорю о данных, искусственном интеллекте и машинном обучении в своей новой книге Будущее здравоохранения: партнерство людей и машин для достижения лучших результатов. Щелкните здесь, чтобы купить себе копию.

Машинное обучение стало проще: что это такое и как работает

Хотите узнать больше?

Вопросы по теме