Каковы текущие применения машинного обучения в реальной жизни / промышленности? С какими глобальными проблемами сталкивается человечество сегодня и как их преодолеть с помощью машинного обучения? Как можно использовать машинное обучение во благо, а как - во зло? Каковы последние исследования машинного обучения? И самое главное: в каком торнадо больше всего сыра?

Дни прикладного машинного обучения 2019 в Лозанне были насыщены докладами, основными докладами и треками, которые должны были ответить на поставленные выше вопросы. Таким образом, масштаб конференции был довольно широким. Он начался с общих разговоров о текущем использовании машинного обучения и его потенциала для решения различных жизненных проблем, а также с презентаций инновационных стартапов машинного обучения. Затем были панельные дискуссии, которые пошли немного глубже и попытались оценить роль машинного обучения в мировом здравоохранении и роль Китая в искусственном интеллекте. Наконец, он закончился небольшими, более техническими треками, которые касались:

AI &
- Города
- Компьютерные системы
- Окружающая среда
- Финансы
- Здравоохранение
- Промышленность < br /> - Интеллектуальная собственность
- Язык
- Аналитика обучения
- Медиа
- Молекулярный мир
- Сети
- Питание
- Общество
- Транспорт
- Доверие

Все это было завершено выступлением Гарри Каспарова, который рассказал анекдоты о своей встрече с темно-синим в 1996/97 году и о роли ИИ с точки зрения Фонда прав человека и автора New York Times Зейнеп Туфекчи, которая указали, что ИИ может помочь нам различать людей способами, которые мы еще не могли. Да, и там были киоски, стендовая сессия, ярмарка вакансий, фортепианные перерывы, небольшая выставка ИИ встречает искусство и множество кофе, чтобы разобраться со всем этим.

Он был упакован, и каждый нашел что-то для себя: AMLD дал людям с ограниченными знаниями в области машинного обучения представление о текущих приложениях, возможностях и ограничениях машинного обучения, чтобы они могли подумать о том, как оно подходит для их компании; но ему также удавалось развлекать подкованных в ML людей докладами и плакатами о новейших исследованиях. А во время перерывов на кофе две группы смогли пообщаться, обменяться идеями, знаниями и визитками.

Как вы понимаете, это было многовато - все вышеперечисленное произошло за два дня. В то время как основные доклады и панельные дискуссии имели отдельные временные интервалы, треки проходили параллельно, с минимальным или отсутствующим временем между отдельными выступлениями, а также с перекрытием времени начала и окончания между разными треками. Все немного беспорядочно, если вы - как я - интересуетесь не только одной конкретной областью, но, скорее, определяете тему отдельного разговора.
Тем не менее, это была интересная конференция с тремя личными моментами: ИИ для добра, ИИ для зла и Данные.

ИИ во благо

Не было никаких конкретных идей или бесед, которые меня удивили, скорее, это была очень важная тема на протяжении всей конференции.
Джефф Дин (Google AI & Health) большую часть своего вводного выступления сосредоточил на том, каким может быть и есть искусственный интеллект в настоящее время, используя для благих целей, спроецировав 14 великих инженерных задач 21 века и поделившись своим пониманием на которую, по его мнению, ИИ окажет наибольшее влияние. Он особенно сосредоточился на обнаружении глазных заболеваний, вызванных диабетом и на том, как алгоритмы машинного обучения уже могут превзойти качество диагностики квалифицированных врачей. Это может оказаться большим подспорьем, поскольку, особенно в развивающихся странах, серьезной проблемой является нехватка врачей и последующая неудачная диагностика заболеваний на ранних стадиях. Другой темой было компьютерное зрение ML на мобильных устройствах, которое позволяет фермерам в Африке диагностировать болезни сельскохозяйственных культур, фотографируя свои растения.

Помимо этого, состоялась панельная дискуссия с представителями ВОЗ и МККК о влиянии ML на глобальное здоровье и управление катастрофами, было несколько разговоров о ML в обработке медицинских изображений, ML для понимания проблем окружающей среды, Стартап, который использовал ИИ в сельском хозяйстве, чтобы сократить использование пестицидов и многого другого.
Опять же, удивили не сами разговоры, а яркая тенденция использования машинного обучения для чего-то более значимого, чем просто побуждение клиентов покупать больше товаров в онлайн-магазинах.

AI для зла

Хотя сама Зейнеп Туфекчи не является экспертом в области машинного обучения, она сделала интересный доклад о том, как ИИ можно использовать для дискриминации людей (не в учебном смысле, а скорее в качестве предупреждения). В то время как большинство людей ассоциируют сценарий судного дня с ИИ, который настигает мир, когда думают о злом ИИ (настоящая проблема, которую действительно необходимо решить), Зейнеп говорила о более непосредственной теме, когда дело доходит до ИИ: дискриминации.

В настоящее время дискриминация часто основана на визуальных признаках, которые легко обнаружить, таких как пол или этническая принадлежность. Хотя мы и близко не подошли к устранению этих видов дискриминации, мы, по крайней мере, знаем о них и часто можем распознать, когда они происходят. Зейнеп отметил, что с алгоритмами машинного обучения, делающими выводы на основе различных источников данных, таких как активность в социальных сетях, вскоре могут появиться новые функции, по которым мы сможем различать, даже не зная об этом.

Один из ее примеров - найм. На первый взгляд может быть выгодно применить объективный алгоритм машинного обучения для выбора человека, которого следует нанять, вместо того, чтобы полагаться на субъективное мнение людей. Но алгоритмы машинного обучения показали, что они могут предсказать вероятность того, что кто-то впадет в депрессию в ближайшем будущем, и они могут сделать выводы о политических взглядах, сексуальной ориентации и личностных качествах из сообщений в социальных сетях. Сможет ли алгоритм машинного обучения избежать найма человека, который может впасть в депрессию и, таким образом, стать обузой для компании? Будет ли он предпочитать не нанимать женщину, потому что, согласно имеющимся данным, она может забеременеть? Проблема в том, что, поскольку алгоритмы машинного обучения часто являются черными ящиками и становятся все более сложными, трудно понять их доводы - часто все, что мы получаем, - это окончательное решение.

Кроме того, алгоритмы машинного обучения далеко не беспристрастны, поскольку они учатся на наших весьма предвзятых данных. Будет ли алгоритм нанимать только людей определенного пола, людей с особыми личностными качествами или людей, принадлежащих к определенной этнической группе, потому что эти люди являются одними из самых успешных в компании? Не осознавая, что это может быть только корреляция, основанная на предыдущих человеческих / культурных предубеждениях, но не действительная причинно-следственная связь?

Это некоторые из новых проблем, о которых нам нужно думать, когда мы применяем машинное обучение к реальным проблемам. И мы должны знать, что это не только сфабрикованное предчувствие того, что может произойти в будущем: алгоритмы машинного обучения уже используются для предсказания будущего преступников, и, похоже, они имеют расовую предвзятость.

Конечно, мы можем получить определенное представление о логике алгоритмов машинного обучения, выполнив обширный аудит, но с их непрозрачностью, растущей сложностью и объемом данных, которые они включают, это легче сказать, чем сделать.

Зейнеп справедливо пришел к выводу, что мы не можем передавать наши моральные обязанности машинам, а должны использовать их только для того, чтобы помогать и направлять нас в принятии наших собственных решений.

Данные

Андрей Карпати (Tesla) в своем докладе на Spark + Ai Summit 2018 описал, как разработка программного обеспечения претерпевает радикальные изменения для определенных типов приложений. В то время как в прошлом разработка программного обеспечения выполнялась людьми, реализующими алгоритмы для создания приложения, которое соответствует фиксированной точке в программном пространстве, будущие алгоритмы разработки программного обеспечения будут искать в этом пространстве оптимальную точку и делают это, оптимизируя ее на базовые данные (если это звучит странно, посмотрите видео, это действительно хорошо;)) Они практически подпитываются данными. Данные - новая нефть.

Это также то, что Джеффри Бон (Swiss Re) попытался передать в своем выступлении: сегодня компании осознают ценность данных и собирают их целыми сериями, но им не хватает важного шага, а именно уточнения или курирования. Недостаточно просто собрать огромные объемы данных, данные необходимо очистить, организовать, описать, а если есть разные источники, их нужно интегрировать и объединить. После этого данные могут быть представлены в визуальном (возможно, даже интерактивном) формате, который позволяет пользователям взаимодействовать с ними, что помогает находить интересные идеи и проводить общий анализ. Данные - это новая нефть: неочищенный продукт, стоимость которого увеличивается после очистки.

Часто одним из этапов кураторства данных является получение достоверных данных (достоверность относится к аннотациям данных с указанием метки true / class / segmentation-mask и т. Д.). В компьютерном зрении это часто может означать присвоение меток изображениям, определение прямоугольников на изображениях, содержащих определенные объекты, или, что еще хуже, тщательное рисование на изображении, чтобы указать, какой пиксель принадлежит кораллу и где начинается камень. Для больших наборов данных это не особенно увлекательная задача (даже для небольших наборов данных - маркировка просто неинтересна), иногда не совсем понятно, к какому классу принадлежит изображение, и если вы не сделаете этого сами, вы должны надеяться чтобы ваши специалисты по маркировке не скучали и не перестали правильно маркировать.

Таким образом, Armand Joulin (исследование искусственного интеллекта Facebook) показал, что может быть полезно уделить больше внимания неконтролируемым моделям (которые не требуют маркированных данных). Как такое возможно? Например, с помощью Автоэнкодеров. Автоэнкодеры, по сути, берут ваши данные и (если вы хорошо их настроили) извлекают те фрагменты информации, которые являются наиболее важными в изображении. Чтобы, если бы вам была предоставлена ​​эта информация, вы смогли бы реконструировать изображение.

Допустим, вы хотите разделить тысячи изображений багажа на разные категории, такие как жесткий мешок, мягкий мешок, рюкзак, коробка и спортивная сумка. Вы можете сделать это контролируемым образом и классифицировать часть изображений вручную, обучить контролируемый алгоритм классификации и позволить ему классифицировать остальные.

Однако с помощью автоэнкодера вам не потребуются ручные аннотации. Вместо этого вы извлекаете важные элементы изображений (надеясь, что они различны для разных классов), чтобы уменьшить каждое из ваших изображений размером 500x500 с 750 000 значений до 1000 функций (коэффициент сжатия 750!).

С этими векторами признаков (вашими закодированными изображениями) вы можете выполнить некоторую многомерную кластеризацию (что на самом деле не так просто), чтобы увидеть, какие векторы близки друг к другу и, таким образом, показать (визуально) похожие классы. Глядя на образцы из этих кластеров, вы могли затем увидеть, какой кластер содержит рюкзаки, какой - жесткие сумки и т. Д. Вуаля: неконтролируемый алгоритм классификации!

Это, очевидно, не так просто, как я себе представляю, но, тем не менее, это важная идея: разметка данных утомительна, неоднозначна, неточна, и нам нужно много этого для хороших алгоритмов. Похоже, нам нужно найти более разумный способ сделать это.

Еще один человек, который, кажется, не считает, что маркировка бесконечных объемов данных - это окончательное решение, - это Адриен Гайдон (Toyota). В своем выступлении За пределами контролируемого вождения он объяснил, как его команда генерирует собственные синтетические данные, чтобы автомобили могли понять реальный мир.

В машинном обучении часто идея состоит в том, что каждая имеющаяся у вас точка данных (например, изображение велосипеда) принадлежит распределению данных. Таким образом, если у вас был доступ ко всем изображениям велосипедов, которые когда-либо были сняты, и вы могли классифицировать их по разным атрибутам, вы могли бы увидеть, что ваш средний велосипед имеет два колеса (можно было бы догадаться по названию), вы могли бы увидеть, какой процент изображений был сделан. под таким же углом и какая пропорция велосипедов зеленые. Если бы у вас был доступ к этому дистрибутиву (а у вас его нет), машинное обучение было бы довольно простым делом.

У вас есть доступ к отдельным точкам раздачи (отдельные фотографии мотоциклов), на которых вы пытаетесь учиться. Идея, лежащая в основе синтетических данных, заключается в том, что вы разрабатываете процесс, который генерирует (случайные) точки данных, которые, если вы позволите этому процессу работать некоторое время, создадут распределение, подобное реальному. Если вам удастся сделать это правильно, вы можете просто использовать точки данных, которые вы создали искусственно, вместо реальных вещей.

Это то, что сделали Адриан и его команда. Вместо того, чтобы использовать реальные видеозаписи, они использовали симулятор вождения: симулятор знал, что имитирует, поэтому они получили аннотации на пиксельном уровне (правдивость) бесплатно! Но хотя симулятор хорошо справился с имитацией физики, поведения и т. Д., Визуальный результат был менее убедительным.

Это означает, что между миром симуляторов и реальностью существовал разрыв (которого вы хотите избежать, если ваши машины должны ездить в реальном мире). Чтобы решить эту так называемую адаптацию домена, они разработали генеративную состязательную сеть (GAN), которая использует изображения и информацию о глубине из симулятора, а также реальные данные для создания генератора, который учится делать смоделированные изображения более реалистичными (полезное приложение для переноса стилей!).

Эти скорректированные данные затем использовались для обучения другой нейронной сети для выполнения сегментации, и в результате получилась сеть, которая никогда не видела реальных изображений, но сумела очень хорошо работать с аннотированным человеком набором данных Cityscapes! Их подход был явно более продуманным, чем то, что я описал, и хорошо изложен в их статье.

Таким образом, с точки зрения сбора, обработки, создания и использования данных, кажется, еще есть чему поучиться и что открыть.

В целом очень интересная конференция, которую стоит посетить. О, и если вам интересно (я ошибся):