Это мои заметки о бесплатной электронной книге О’Рейли «Машинное обучение для дизайнеров».

http://www.oreilly.com/design/free/machine-learning-for-designers.csp

Краткое описание. Машинное обучение отлично подходит для некоторых ограниченных областей применения, и необходимо учитывать потребности пользователей.

В то время как традиционное программирование дает предсказуемые результаты, машинное обучение дает неожиданные результаты. Хорошим примером является то, как лица распознаются как лица. Человек и машина никогда не перестанут распознавать лицо как лицо, но будут давать огромное количество ложных срабатываний в сумерках и тумане. Или, может быть, машина научится распознавать лица каким-то неожиданным образом, например, африканская пара, которую причислили к паре горилл.

Традиционные программы являются дедуктивными, а системы машинного обучения — индуктивными.

Книга содержит хороший обзор истории машинного обучения от персептрона до термодинамических систем. А также большое изложение терминов машинного обучения.

Контролируемое/неконтролируемое обучение. Контролируемое обучение хорошо подходит для категоризации/прогнозирования ценности. Неконтролируемое обучение создает генеративные модели, которые можно использовать для создания более художественного контента.

Обучение с полуучителем сочетает в себе обучение без учителя для выявления общих черт во входных данных, а затем обучение с учителем для категоризации. Это весьма полезно, например, когда есть много изображений, которые необходимо классифицировать. Неконтролируемое обучение сначала находит все пивные бутылки и пустые улицы, а затем изображения классифицируются по этим обнаруженным категориям.

В усиленном обучении используются поощрения и наказания. Лучше всего он работает при заданной степени свободы действий, которая приводит к явным успехам или поражениям. Например, когда робот учится ходить или играть в го.

Глубокое обучение — это, по сути, комбинация процессов обучения, которые используются один за другим для решения сложных проблем поэтапно, вместо того, чтобы пытаться изучить все за один раз.

Станет ли глубокое обучение Святым Граалем машинного обучения, остается открытым вопросом. Потому что, хотя это и многообещающе, это не первый случай, когда путь к мощному искусственному интеллекту выглядит гладким.

Машинное обучение открывает перед дизайнерами новые возможности. Теперь есть реальная возможность интерпретировать человеческий голос, выражения лица и позы тела среди прочего. Это открывает перед дизайнерами широкую новую область интерактивных инструментов. В качестве тривиального примера пользователи могут лайкать/не любить посты в социальных сетях своей улыбкой/хмурым взглядом. Сложный пример — камера, которая отслеживает поле зрения слепого человека и описывает, что в нем находится. В книге приведено множество других примеров.

По мере того, как машины учатся интерпретировать больше действий пользователя, помимо щелчков мышью, появляется возможность создавать естественные интерфейсы, реагирующие на голос, мимику и жесты. В идеале использование этих интерфейсов будет похоже на разговор с умным коллегой, однако существует реальная вероятность того, что эти интерфейсы будут использоваться так же, как и любая командная строка без надлежащего цикла обратной связи. Мы можем использовать многие знания из пользовательского интерфейса Voice для создания действительно полезных естественных интерфейсов.

По-настоящему интересным ответвлением интеллектуального интерфейса был бы пользовательский интерфейс, генерируемый на лету в соответствии с потребностями пользователя в данный момент. Например, при покупке автомобиля пользователю может быть предоставлен селектор цвета только в том случае, если интеллектуальный интерфейс определяет, что пользователь собирается изменить цвет. В то время как компоненты пользовательского интерфейса останутся традиционными кнопками и полями ввода, эти компоненты будут генерироваться только при необходимости.

Полезность системы машинного обучения напрямую зависит от набора данных, используемого для ее обучения. Как это происходит и в традиционном программировании, мусор на входе равен мусору на выходе. Это стало поразительно очевидным с Microsoft Chatbot Tay, которому потребовался всего один день взаимодействия с Twitterverse, чтобы стать сквернословящим расовым фанатиком. Но опять же Тай держал темное зеркало, чтобы человечество могло увидеть себя. Для любой цели входной набор данных должен быть хорошо подобран и иметь следующие характеристики: полнота, точность, непротиворечивость и своевременность. Набор данных должен быть достаточно большим, с наименьшим количеством возможных ошибок, не противоречащим самому себе и из правильного времени и места для нужд. Получение наборов данных хорошего качества является одним из основных препятствий на пути использования машинного обучения. Например, Google использует набор данных из 14 миллионов изображений, которые были описаны с помощью 22 000 категорий, для обучения системы классификации изображений Google.

Неопределенность будет огромной проблемой для систем машинного обучения. В то время как миллионы систем могут работать безупречно, достаточно, чтобы одна система не смогла создать серьезные проблемы с автоматизацией. Например, когда пьяный водитель убивает ребенка, практически никто не требует прекращения продажи алкоголя и вождения человека. Но если робот сделает то же самое, возникнет огромный протест против автоматизированного вождения. И всегда будут новые требования к системам реального мира, вещи, которые не были частью исходного набора входных данных, неизвестные неизвестные. Повышение функциональности автоматики будет стоить снижения надежности. Эта сниженная надежность может быть смягчена резервными системами, будь то человек или традиционная программа.

Аналогичное рассмотрение необходимо для обычаев и манер систем машинного обучения. Наборы данных могут и обычно содержат человеческие предубеждения, и хотя они могут казаться безвредными, они будут усиливаться, когда они появляются в выходных данных системы машинного обучения. Хорошим примером этого было, когда изображение черной пары было отнесено к категории пары горилл. С точки зрения машинного обучения это был всего лишь небольшой сбой, хотя на самом деле это была крупная катастрофа для связей с общественностью. Поэтому существует необходимость в обычаях и манерах фильтровать выходы, которые неприемлемы. Эта фильтрация не может быть системой машинного обучения, а курируется или запрограммирована человеком.

В заключение роль дизайнера в машинном обучении будет заключаться в том, чтобы выяснить, какие результаты он хочет получить из входных данных и какие интерфейсы он может создать с помощью новых функций. Но, в конце концов, потребности пользователей будут основываться на той же психологии, что и при изобретении огня.