Что такое глубокое обучение? И как сюда вписывается линейная регрессия?

Машинное обучение — это когда компьютеры обрабатывают большое количество наблюдений за миром, а затем изучают закономерности или взаимосвязи в этих наблюдениях. Они используют изученные модели и отношения, чтобы предсказать новые наблюдения (результаты) о мире. Машинное обучение включает в себя область статистического обучения, которая является хорошо разработанной темой, которая долгое время создавала замечательные инструменты.

Как глубокое обучение (последнее увлечение машинным обучением), так и линейная регрессия (очень старомодный метод) являются формами статистического обучения. Далее я бы сказал, что любой алгоритм машинного обучения является формой статистического обучения, потому что основные принципы статистического обучения необходимы для обучения машины на данных, которые вы ей вводите. (Обучение на данных — это обучающая часть машинного обучения.) На самом деле мне неизвестны какие-либо формы машинного обучения, кроме статистического обучения, но здесь я держу свое мнение открытым.

Является ли линейная регрессия действительно машинным обучением?

Линейная регрессия — это всего лишь одна из тех скучных вещей, которые вы делали в статистике. Как это могло быть машинным обучением? Когда вы выполняете линейную регрессию (практически с любым статистическим программным обеспечением), машина буквально изучает параметры линейной модели из обучающего набора данных. Обученная линейная модель берет наблюдения (X) и предсказывает результаты (Y) — и она научилась этой способности предсказания из данных, которые вы ей предоставили.

Когда вы вводите в эту обученную модель новое наблюдение (новый X), она будет предсказывать новый Y. Если вы также добавите это новое наблюдение в набор обучающих данных, вы также обновите параметры своей модели (т. е. адаптивно изучите лучшую модель, которая является лучшим предиктором, чем последний). Это то, что происходит, когда программа для игры в шашки с искусственным интеллектом (или любой алгоритм машинного обучения) со временем становится умнее.

Хватит с X и Y. Можно пример?

Предположим, вам нужен алгоритм, который мог бы предсказать, какие лекарства убьют клетку. Для этого вам нужно будет передать алгоритму обучающий набор данных, состоящий из структурных особенностей лекарств (X) и их влияния на клетку (Y), чтобы он мог параметризовать (обучить) базовую прогностическую (математическую) модель. Параметры модели фиксируют взаимосвязь между структурными особенностями лекарственного средства и эффектами клеток. Затем вы представляете модели новое лекарство (лекарство «новое», потому что оно представляет собой новую комбинацию структурных особенностей, которых алгоритм никогда раньше не видел). Модель предскажет эффект уничтожения клеток этим новым лекарством. Если прогноз верен, мы инстинктивно чувствуем, что машина «умная» и «извлекла уроки» из данных. Все, что он действительно сделал, это подогнал модель. Если это неправильно — мы думаем, что это так же умно, как скрепка.

Вы можете использовать линейную модель для такого алгоритма обучения (это линейная регрессия), или вы можете использовать модную модель, такую ​​​​как нейронная сеть (некоторые формы которых являются алгоритмами глубокого обучения). И есть множество других типов моделей. Независимо от того, какой подход к моделированию вы выберете, парадигма обучения/прогнозирования будет одинаковой.

Итак, каждый раз, когда вы запускаете регрессионный анализ, верите вы в это или нет, вы буквально выполняете машинное обучение. Это не так привлекательно, как самоуправляемый автомобиль, но линейная регрессия действительно представляет собой настоящее машинное обучение. Да, вы уже много лет работаете специалистом по данным и даже не подозреваете об этом.

В естественных науках старой доброй регрессии часто бывает более чем достаточно. Фактически, для «мелких и широких» (также известных как недоопределенные) данных, столь распространенных в науках о жизни, линейная регрессия часто является лучшим вариантом. Ограничения линейной модели помогают вам извлечь что-то разумное из ваших данных, когда нейронные сети не могут даже выйти из стартовых ворот. На конференции по машинному обучению, которую я посетил в марте 2018 года (спонсируемой ATUM и Autodesk), докладчики показали, что методы линейной регрессии превосходят модели нейронных сетей в предсказании фенотипов по последовательностям нуклеиновых кислот. (Регрессия Лассо оказалась победителем. Она была разработана в начале 2000-х годов.) В других случаях нейронные сети серьезно надрали зад, особенно в обработке изображений.

Так что же такое глубокое обучение?

Глубокое обучение — это форма машинного обучения, в которой в качестве модели используется нейронная сеть — в частности, слои нейронных сетей, формирующие глубокие стеки взаимосвязанных узлов. В глубоком обучении существует так много нейронных слоев, что модель может иметь миллионы параметров, требующих для их решения миллионов часов ЦП. Эти модели были по существу неразрешимы (и, следовательно, бесполезны в практических приложениях) до тех пор, пока около 10 лет назад не получили широкое распространение графические процессоры (обеспечивающие мощность) и не был изобретен метод их быстрого решения (здесь). Увлечение ИИ, которое мы знаем сегодня, основано на впечатляющей (почти волшебной) производительности таких моделей глубокого обучения и методов обучения таким сложным задачам, как классификация изображений. С такими проблемами не очень хорошо справились прежние методы машинного обучения. Чтобы получить хороший обзор недавней истории всего этого, ознакомьтесь с этим семинаром Джона Кауфхолда, основателя Deep Learning Analytics.

Что такое "контролируемое" и "неконтролируемое" обучение?

Когда вы передаете модели как наблюдения (X), так и результаты (Y) и просите ее изучить взаимосвязь между ними, это «обучение с учителем». Вы наблюдаете за машиной с примерами того, что она должна предсказывать на основе набора наблюдений.

Неконтролируемое обучение — это когда вы вводите только наблюдения (только X) без каких-либо результатов (без Y) и просите машину сгруппировать или разложить наблюдения на набор шаблонов. Каждая закономерность представляет общие характеристики некоторой части наблюдений. Неконтролируемое обучение — это проблема классификации — обучение здесь осуществляется путем нахождения модели, которая может сортировать (классифицировать) наблюдения в оптимальный набор шаблонов. Что является «оптимальным», определяет разработчик алгоритма. Например, это может быть определена как любая модель, которая создает желаемое количество шаблонов, или как модель, которая может наиболее точно регенерировать исходные данные, или это может быть комбинация обоих критериев.

После того, как вы изучили модель таким образом без присмотра, вы можете (как обычно) передать ей новое наблюдение, и она отсортирует это наблюдение в шаблон (например, шаблон кошка) или разложит его на набор шаблонов (например, визуальный). черты или части тела, определяющие кошку). Это прогнозирующая часть неконтролируемого обучения. Этот тип обучения — это то, что обычно делают алгоритмы анализа изображений, например, разделение изображений на хот-доги и не хот-доги в куче изображений обоих.

Что такое ИИ?

ИИ — это расплывчато определенный термин, используемый в популярной культуре для обозначения набора методологий машинного обучения, которые при объединении в программные приложения и устройства, кажется, наделяют машины умными. Если бы существовало что-то близкое к определению ИИ, это был бы тест Тьюринга. Но это не то, что это означает в нашей популярной культуре сегодня.

Какие инструменты используются для машинного обучения?

Сейчас существует множество наборов инструментов для машинного обучения (Apache Spark MLib, JMP, TensorFlow, SAS, R, Scikit-learn, инструменты машинного обучения Amazon и т. д.). Это своего рода мир выбери свой любимый. Все они в конечном итоге приведут вас к одному и тому же месту. Вот список некоторых из них.

Отчасти из-за этих наборов инструментов машинное обучение стало сегодня такой значительной частью популярной культуры. Они легко доступны, бесплатны и открыты — это означает, что почти каждый может возиться с ними так же, как они возились с радиоприемниками в 1950-х годах.

Если вам интересно, как применить машинное обучение в вашей науке, свяжитесь с нами по адресу [email protected].