Три вещи, которые вам нужно знать о машинном обучении

Машинное обучение в моде, а серьезные улучшения в инфраструктуре, хранении данных и внедрении облачных технологий привели к растущему интересу к этой сфере. Многие улучшения, ориентированные на потребителя, связаны с Google и Facebook, но другие компании также инвестируют в эту область. Однако, учитывая весь ажиотаж вокруг машинного обучения, важно понимать некоторые нюансы и механизмы того, что такое машинное обучение и как оно работает. Как инвестор Redpoint Ventures, я имею честь учиться у людей и компаний, использующих новейшие технологии.

Итак, что такое машинное обучение и искусственный интеллект? Искусственный интеллект (ИИ) - это программное обеспечение, которое делает то, что делают люди, но быстрее и, надеюсь, лучше. Например, расшифровка заметок о встрече и выделение всех последующих задач. Машинное обучение - это один из подходов к достижению ИИ с использованием алгоритмов вместо традиционных вручную закодированных деревьев решений на основе правил. На высоком уровне машинное обучение состоит из трех этапов: ощущение, рассуждение и производство.

Машинное обучение приобрело большую популярность и стало более возможным за последние пять лет.

В области машинного обучения было сделано несколько достижений, которые привели к усовершенствованию методов, приложений и общей доступности метода, например, развитие облачных вычислений и распространение данных.

Существует четыре основных фактора, которые привели к нынешнему увеличению числа компаний, использующих машинное обучение в своих продуктах.

Пейзаж машинного обучения и его потенциал влияния на продукты и услуги в будущем можно рассматривать тремя способами:

Выход №1: Машинное обучение не является монолитным

В машинном обучении существуют разные типы обучения (например, контролируемое, неконтролируемое) и различные методы (например, регрессия, нейронные сети). Эти методы и типы обучения не только соответствуют друг другу, но используются в различных комбинациях в зависимости от ситуации. Ниже я поделился, как я наглядно это обозначил.

Типы обучения:

Под наблюдением: контролируемое обучение выявляет закономерности в данных с учетом заранее определенных характеристик и помеченных данных (например, традиционное страхование)
Без учителя: обучение без учителя выявляет закономерности в данных, что особенно полезно для немаркированных и неструктурированных данных (например, спама в Gmail).
Полу-контролируемый: сочетание обучения с учителем и без учителя. Лучше всего в ситуациях, когда есть некоторые помеченные данные, но их мало (например, сегментация клиентов)
Подкрепление: обучение с подкреплением обеспечивает обратную связь с алгоритмом во время его обучения; это по сути процесс принятия решений, основанный на опыте (например, игра в шахматы)

Вывод №2. Глубокое обучение стало методом, обладающим серьезными преимуществами, но также имеющим важные недостатки

Глубокое обучение включает в себя множество слоев нейронных сетей, алгоритмов, смоделированных на основе структуры человеческого мозга, что делает сеть «глубокой». Мы часто слышим о преимуществах глубокого обучения для обучения без учителя и обучения с подкреплением, что на самом деле привело к значительным достижениям в обеих областях, хотя это не всегда требуется. Глубокое обучение также может быть полезным при обучении с учителем при решении больших и сложных задач.

Глубокое обучение имеет три ключевых преимущества по сравнению с другими методами. Он надежный, универсальный и масштабируемый. Это надежный, потому что функции, характеристики, используемые для дифференциации или классификации данных, не требуют предварительного определения; изучаются оптимальные функции для данной задачи. Это универсальный, потому что один и тот же подход нейронной сети может использоваться для разных приложений и типов данных. И он масштабируемый, потому что метод является 1) параллелизируемым, т. Е. Может выполняться на нескольких процессорах и 2) производительность улучшается с увеличением объема данных, уменьшая вероятность того, что вы обучите алгоритм способом это верно только для конкретных обучающих данных (т. е. переобучения).

Это имеет важные последствия, в частности, для трех областей: обработки естественного языка, компьютерного зрения и робототехники.

В то же время при использовании глубокого обучения следует помнить о недостатках. Один из важных моментов заключается в том, что, когда нейронная сеть определяет, что определенные функции важны, и принимает решения на их основе, мы не знаем, почему. Это означает, что если в системе есть поврежденные данные или человеческая предвзятость, мы не сможем точно определить ее существование, что может быть опасно для конкретных случаев использования, таких как различные области финансов и правоохранительных органов, которые могут повлиять на общество.

Кроме того, для эффективных моделей глубокого обучения требуется чрезвычайно большой объем данных и вычислительная мощность, что требует больших затрат и времени. Это важный компромисс, о котором следует помнить, особенно для молодых стартапов, которые создают свои продукты с ограниченным бюджетом.

Таким образом, глубокое обучение не всегда является лучшим подходом, скорее, для каждого конкретного случая использования специалистам по обработке данных необходимо учитывать возможность предвзятости, доступность вычислительных ресурсов и доступ к данным.

Вывод №3. Машинное обучение будет иметь большое значение для того, какие продукты будут выглядеть в будущем

Машинное обучение - это не решение само по себе, а инструмент для оптимизации желаемого результата. Поэтому компании, использующие машинное обучение, должны сосредоточиться на предоставлении практических сведений и перейти от помощи клиентам в манипулировании данными для анализа к сосредоточению внимания на стратегии и рекомендациях, которые сделают процесс принятия решений более эффективным и точным. Вполне вероятно, что пользовательский интерфейс упростится, и вы сможете сосредоточиться на рекомендациях по действию вместо предоставления множества вариантов выбора. Ниже приведены два примера, иллюстрирующих ранние версии этого сдвига.

Механизм добавления тегов к фотографиям в Facebook перешел на рекомендуемые теги (слева), что делает его более умным и простым в использовании, чем его предыдущая версия (справа).

Точно так же Google Now запоминает, где припаркуется пользователь (слева), и рекомендует, когда ему следует выехать в аэропорт (справа), исходя из времени полета, текущего местоположения и информации о дорожной обстановке. За этим ориентированным на рекомендации упрощенным пользовательским интерфейсом будет будущее пользовательских интерфейсов продукта.

Эти примеры демонстрируют огромное влияние, которое машинное обучение окажет, поскольку оно продолжает предоставлять продукты, которые более эффективны и просты в использовании.

Чтобы узнать больше о машинном обучении и его последствиях для продуктов и стартапов, подпишитесь на меня в Twitter @mkhandel и Medium at @medhaa.

Три вещи, которые вам нужно знать о машинном обучении

Вопросы по теме