Машинное обучение

Обучен ли ИИ с помощью компьютеров и данных? Да, но сначала вам нужен человек.

Внимательно посмотрите на изображение на экране. Внимательно исследуйте каждый пиксель. Обозначьте дома, здания, фонарные столбы. Выберите и отметьте край дороги. Не забывайте обращать внимание на движущееся движение.

Делайте это осторожно, делайте это хорошо. У каждого пикселя есть свое место.

Похоже на мысли о беспилотном автомобиле? Собственно, это должностные инструкции тех, кто помогает тренировать.

Когда думаешь об искусственном интеллекте и машинном обучении, то представляешь компьютерных программистов, набивающих код на своих терминалах. Вы можете подумать о том, чтобы загрузить огромные библиотеки изображений, нажать «Анализировать» и позволить компьютеру решить все остальное. И вы, вероятно, могли бы представить, что это происходит в высокотехнологичном офисе в таком месте, как Кремниевая долина в США.

На самом деле места, где происходят первые и самые важные шаги, больше похожи на Найроби, Кения.

Как машины учатся? Все очень просто и в то же время довольно сложно, но идея, по сути, в следующем.

Допустим, вы хотите распознать лица на фотографии. В наши дни это очень распространенная функция, и раньше было непросто сделать это. Люди кропотливо программировали, как именно должно выглядеть лицо, сообщая своим алгоритмам искать определенные линии и кривые, организованные по определенному шаблону. Это было достаточно сложно сделать для алфавитов, не говоря уже о лицах.

Но теперь машинное обучение позволяет компьютеру разбираться в этом сам. Вы начинаете с базовой «нейронной сети» и обучаете ее делать то, что вы хотите. Так что вы найдете миллион фотографий с изображением лиц, на которых написано: «У этого есть лицо». И вы найдете два миллиона фотографий без лица, на которых написано, что «у него нет лица».

Компьютер автоматически проанализирует все фотографии и найдет общий шаблон для работы. «Ага, эти пиксели выстроены в линию, увеличивают вероятность того, что это лицо», - говорится в сообщении, «а вот этот внизу означает, что, вероятно, это не так». За исключением того, что все это скрыто, поэтому у вас нет возможности точно узнать, какой образец обнаружил ваша машина. Ищет ли он глаза и рот? Или кружок с носиком? Или что-то невообразимо иное?

Прежде чем вы сможете обучать машину, вам нужны данные для ее обучения. Вам нужна папка с миллионом фотографий лиц и еще одна, в которой их гарантированно не будет.

Это означает, что вам нужен кто-то, кто займется сортировкой.

Иногда можно пойти по легкому пути. Пользователи Facebook, возможно, заметили, как это эволюционировало. Во-первых, Facebook позволяет вам нажимать на лицо человека, чтобы «пометить» этого человека: для вас создается набор данных «лицо» и «без лица». Используя это, они научились автоматически определять лица и предлагать вам пометить их именами. А теперь алгоритм настолько хорош, что он сам может помечать людей без подсказки.

Конечно, это не ограничивается лицами. Любые изображения с соответствующими подписями потенциально могут помочь машинам распознавать объекты. Вы когда-нибудь задумывались, почему Google позволяет загружать неограниченное количество фотографий? Теперь ты знаешь.

Бывают случаи, когда массового тегирования сообщества недостаточно. Для этого вам нужны специализированные работники. И здесь на помощь приходит Найроби, Кения.

В Найроби находится одна из торговых точек Samasource, компании, которая создает наборы данных для машин, на которых можно тренироваться. Среди его клиентов Google, Facebook и Microsoft. Они нанимают жителей поблизости, в том числе из Киберы, самых больших трущоб на континенте. Людям платят 9 долларов в день за выполнение одной задачи, которую не могут выполнить машины: создание данных для обучения.

В основном это аннотации. «Это фонарный столб», - скажете вы компьютеру. «Это выбоина. Это тень. Это ворона, которая кладет гайку на дорогу, чтобы машины ломали ее при наезде ». Что ж, может быть, не последний, но у вас может возникнуть соблазн добавить его, потому что работа такая скучная, однообразная и скучная.

Между прочим, если вы хотите сами попробовать такую ​​работу, то можете. Просто зарегистрируйтесь в Amazon Mechanical Turk, который предлагает скучные, повторяющиеся задачи, которые люди по-прежнему выполняют лучше, чем машины. Вам будут платить 1 доллар в час. Развлекайся.

Работа в Samasource может быть однообразной, но, условно говоря, это хорошо окупается. Компания нацелена на людей, которые в настоящее время зарабатывают 2 доллара в день, что более чем в четыре раза превышает их доход.

Они также предлагают комнаты для кормления грудью и девяностодневный отпуск по беременности и родам, а также нанимают больше женщин, чем мужчин в стране, где материнство обычно исключает возможность даже карьерного роста. Многие люди начали работать в Samasource, а затем перешли к более важным вещам.

Тогда, конечно, есть смысл помочь чему-то большему. Создавая эти данные и тщательно разрабатывая карты, вы совершаете революцию в области искусственного интеллекта - пусть и такую, которая не будет ощущаться в вашей местности еще долгое время, - что иначе было бы невозможно.

Данные тренировки важны. На самом деле это гораздо важнее, чем вы думаете. То, как вы выбираете данные, определяет то, как завершаются ваши алгоритмы - и в некоторых случаях вам нужно быть очень и очень осторожным.

В 2015 году алгоритмы Google пометили двух афроамериканцев как «горилл». Оказывается, его обучали в основном на фотографиях «белых» людей (или «розовых» людей, как их назвали бы коренные американцы). Так что, если были показаны какие-либо другие люди, ему было труднее распознать их как людей.

Некоторые случаи даже более серьезны. Скрытный стартап Palantir использует искусственный интеллект, чтобы помочь полиции поймать преступников. Но в США полиция склонна осуждать «черных» больше, чем «белых». Если алгоритм использует полицейские записи в качестве тренировочных данных, очень высока вероятность, что он также выявит предубеждения полиции.

Проблема с машинным обучением в том, что это черный ящик. Мы не даем машинам конкретных инструкций; мы просто говорим: «Это то, что вам нужно сделать, теперь определите свою формулу». И это работает.

Но мы не знаем, как это работает. Мы не можем видеть формулу, и даже если бы мы могли, нет никакой гарантии, что мы ее поймем. По сути, они берут множество факторов и сравнивают их друг с другом, и никто не знает, какие, когда и почему.

Как гласит история, однажды в 1980-х годах военные США пытались обучить компьютер. Они хотели, чтобы он отличал российские танки от американских. И это сработало: они получили очень хорошие результаты со своими тестовыми данными. Но все фотографии русских танков были размытыми, а все фотографии американских танков были качественными.

Как позже выяснилось в армии, машина вообще не научилась распознавать танки: она просто научилась распознавать размытые картинки в высоком разрешении.

Чтобы доверять алгоритмам машинного обучения, нам нужно кое-что объяснить, как они работают. И это то, над чем работает Бин Ким, исследователь из Google Brain.

Ее система, Testing Concept with Activation Vectors, или TCAV, выясняет, какое влияние оказывает определенная «функция ввода» на решение алгоритма. Это помогает людям узнать, как алгоритм работает.

Возьмем, к примеру, медицинский анализ. Теперь алгоритмы могут диагностировать такие вещи, как рак, часто с большей точностью, чем профессиональные врачи. Но они не могут сказать почему. И вы не были бы счастливы, если бы подошел врач и сказал: «Вам лучше принять это лечение, потому что так сказал алгоритм».

С помощью TCAV вы можете увидеть, на чем алгоритм основывает свои решения. Вы можете наблюдать за входными функциями, такими как «сросшиеся железы», «возраст пациента» и «прошедшая химиотерапия», и видеть, какое влияние каждый из этих факторов оказывает на принятие решений. TCAV делает это, отправляя два набора данных, один с функциями ввода, а другой без, и посмотреть, как реагирует алгоритм.

Вы не можете узнать все об алгоритме с помощью TCAV. Но вы, по крайней мере, можете получить представление. Вы можете проверить догадку. Вы можете спросить: «Этот алгоритм больше полагается на насадку бака или зернистость фотографии?»

Раньше вы просто вставляли данные и надеялись, что это сработает. Теперь вы можете заглянуть внутрь и получить некоторое представление о том, как идут дела.

Но если они ошибаются, возможно, пора возвращаться в Найроби.

Хотите писать вместе с нами? Чтобы разнообразить наш контент, мы ищем новых авторов, которые будут писать в Snipette. Это значит ты! Начинающие писатели: Мы поможем вам придать форму вашему произведению. Авторитетные писатели: Нажмите здесь, чтобы начать.

Хотите узнать больше? Источники и ссылки для этой статьи можно найти здесь.