Ирвинг Владавски-Бергер

Искусственный интеллект быстро становится одной из важнейших технологий нашей эпохи. Каждый день мы можем читать о последних достижениях в области искусственного интеллекта от стартапов и крупных компаний. За последние несколько лет собрались необходимые ингредиенты, чтобы перевести ИИ через порог: мощные и недорогие компьютерные технологии; огромное количество данных; и продвинутые алгоритмы, особенно машинное обучение. Машинное обучение позволило ИИ обойти одно из самых больших препятствий - так называемый парадокс Поланьи.

Явные знания формальны, систематизированы и могут быть легко объяснены людям и зафиксированы в компьютерной программе. Но неявное знание, концепция, впервые представленная в 1950-х годах ученым и философом Майклом Поланьи, - это тот вид знания, о котором мы часто не догадываемся, и поэтому его трудно передать. другому человеку, не говоря уже о захвате в компьютерной программе.

Мы можем знать больше, чем можем сказать, - сказал Поланьи, что стало известно как парадокс Поланьи. Эта фраза здравого смысла лаконично отражает тот факт, что мы неявно знаем много о том, как устроен мир, но не можем явно описать это знание.

Неявные знания лучше всего передаются через личное общение и практический опыт. Повседневные примеры включают говорение на языке, езду на велосипеде и легкое распознавание множества разных людей, животных и предметов.

Машинное обучение и связанные с ним достижения, такие как глубокое обучение, позволили компьютерам приобретать неявные знания, обучаясь с большим количеством образцов входных данных, таким образом, обучаясь путем анализа больших объемов данных вместо явного программирования. Методы машинного обучения теперь применяются к зрению, распознаванию речи, языковому переводу и другим возможностям, которые еще недавно казались невозможными, но теперь приближаются или превосходят человеческий уровень производительности в ряде областей.

Поскольку область его приложений продолжает расширяться, машинное обучение (ML) вызывает серьезные опасения по поводу своего влияния на автоматизацию и будущее труда. В Что умеет машинное обучение? Влияние на рабочую силу , недавно опубликованная в Science статья, профессор Массачусетского технологического института Эрик Бриньолфссон и профессор CMU Том Митчелл исследуют этот вопрос, анализируя, какие задачи особенно важны. подходит для машинного обучения, а также его ожидаемое влияние на рабочую силу и экономику. [Прочтите полный текст исследования здесь и посмотрите, как Бриньолфссон объясняет концепцию в этом видео].

Вот краткое изложение статьи в Science:

Какие задачи больше всего подходят для машинного обучения?

Системы машинного обучения не одинаково подходят для всех задач. Наиболее успешно он применяется с алгоритмами контролируемого обучения и глубокого обучения, которые требуют использования для обучения очень больших объемов тщательно размеченных данных, например кот, не кот. Хотя они очень эффективны в таких областях, авторы напоминают нам, что системы машинного обучения значительно уже и более специализированы, чем люди. Есть много задач, для которых они совершенно неэффективны, учитывая текущее состояние дел.

Бриньолфссон и Митчелл определяют восемь ключевых критериев, которые помогают отличить задачи, подходящие для ML, от тех, для которых ML менее вероятно будет успешным.

  • Изучение функции, которая сопоставляет четко определенные входные данные с четко определенными выходными данными. К таким функциям относится классификация, например маркировка изображений конкретных животных или вероятности рака в медицинских записях; и прогнозы - например, вероятность невыполнения обязательств по кредитной заявке. Они составляют статистические корреляции без обязательного учета причинных эффектов.
  • Большие (цифровые) наборы данных существуют или могут быть созданы, содержащие пары ввода-вывода. Чем больше набор данных для обучения, тем точнее обучение. Одна из ключевых особенностей алгоритмов глубокого обучения заключается в том, что, в отличие от классических аналитических методов, нет предела асимптотического размера данных, после которого они перестают улучшаться.
  • Задача обеспечивает четкую обратную связь с четко определенными целями и показателями. «Машинное обучение работает хорошо, когда мы можем четко описать цели, даже если мы не всегда можем определить лучший процесс для достижения этих целей». ML особенно эффективен при наличии конкретных общесистемных показателей производительности - например, получить наибольшее количество очков в видеоигре, оптимизировать общий транспортный поток в городе - и такие показатели могут быть включены в данные обучения.
  • Никаких длинных логических цепочек или рассуждений, зависящих от разнообразных базовых знаний или здравого смысла. «Системы машинного обучения очень сильны в изучении эмпирических ассоциаций в данных, но менее эффективны, когда задача требует длинных цепочек рассуждений или сложного планирования, опирающегося на здравый смысл или базовые знания, неизвестные компьютеру». ML хорошо работает в ситуациях, требующих быстрой реакции и обеспечивающих быструю обратную связь, например, в видеоиграх. Он хуже справляется с событиями, которые зависят от контекста, установленного несколькими предыдущими событиями.
  • Нет необходимости подробно объяснять, как было принято решение. Объяснить человеку причину того или иного решения или рекомендации, сделанной алгоритмом машинного обучения, довольно сложно, потому что его методы - тонкие корректировки числовых весов, которые связывают его огромное количество искусственных нейронов - настолько отличаются от тех, которые используются людьми.
  • Терпимость к ошибкам и отсутствие необходимости в доказуемо правильных или оптимальных решениях. Алгоритмы машинного обучения получают свои решения на основе статистики, присваивая вероятности различным вариантам, которые он оценивает. Их редко удается обучить со 100% точностью. Даже лучшие системы машинного обучения допускают ошибки, как и лучшие люди, поэтому важно осознавать, что они несовершенны.
  • Изучаемое явление или функция не должны быстро меняться с течением времени. «В общем, алгоритмы машинного обучения работают хорошо только тогда, когда распределение будущих тестовых примеров аналогично распределению обучающих примеров». Если функция быстро меняется со временем, обычно требуется переобучение, требующее получения новых обучающих данных.
  • Не требуется специальной ловкости, физических навыков или подвижности. Системы машинного обучения уже превзошли человеческий уровень производительности в ряде задач. Однако, хотя мозг роботов с цифровым ИИ работает достаточно хорошо, их физические возможности все еще довольно неуклюжи по сравнению с людьми, особенно при работе с неструктурированными задачами и средами.

Статья Science включает в себя довольно подробные дополнительные материалы, чтобы помочь оценить, что текущее поколение систем машинного обучения может и чего не может.

Последствия для персонала

С 1980-х годов возможности трудоустройства в США резко поляризовались. Профессии со средним уровнем квалификации, связанные с рутинным ручным (рабочие) и когнитивными (белые воротнички) задачами, сокращаются, поскольку они склонны к автоматизации и передаче на аутсорсинг странам с более низкой заработной платой. В то же время мы наблюдаем неуклонный рост числа рабочих мест, связанных с нестандартными ручными задачами с низкой квалификацией, например услуги по еде и уборке, личный уход и помощники по уходу за здоровьем, а также нестандартные, высококвалифицированные когнитивные задачи, например управленческие, профессиональные и технические профессии.

Мы вступаем в новую эру автоматизации. В ближайшие годы наши все более умные машины будут автоматизировать более широкий набор задач. Уже недостаточно смотреть на рутинные и нестандартные задачи, чтобы предсказать, какие задачи подходят для автоматизации.

Сейчас кандидатами на автоматизацию машинного обучения становится гораздо более широкий набор задач. «Таким образом, простая экстраполяция прошлых тенденций может ввести в заблуждение, и необходима новая структура».

Большинство занятий включает в себя ряд занятий или задач. Некоторые из этих видов деятельности более восприимчивы к автоматизации, в то время как другие требуют рассудительности, социальных навыков и других трудных для автоматизации человеческих способностей. Но то, что некоторые действия в работе были автоматизированы, не означает, что вся работа исчезла. Напротив, автоматизация частей работы часто повышает продуктивность и качество рабочих, дополняя их навыки машинами и компьютерами, а также позволяя им сосредоточиться на тех аспектах работы, которые больше всего требуют их внимания.

Согласно недавнему исследованию McKinsey, хотя почти половину всех видов деятельности можно практически автоматизировать к 2030 году за счет адаптации доступных в настоящее время технологий, некоторые профессии, вероятно, полностью исчезнут. Вместо этого все больший процент профессий испытает значительные изменения.

«Хотя экономические эффекты машинного обучения сегодня относительно ограничены, и мы не сталкиваемся с неизбежным концом работы, как иногда объявляется, последствия для экономики и рабочей силы в будущем огромны…» - пишут Бриньолфссон и Митчел. «Недавняя волна контролируемых систем обучения уже оказала значительное экономическое влияние. Предельные масштабы и масштабы дальнейших достижений в области машинного обучения могут соперничать или превосходить предыдущие технологии общего назначения, такие как двигатель внутреннего сгорания или электричество. Эти достижения не только напрямую повысили производительность, но, что более важно, вызвали волну дополнительных инноваций в машинах, организации бизнеса и даже в экономике в целом ».

«Отдельные лица, предприятия и общества, которые сделали правильные дополнительные инвестиции - например, в навыки, ресурсы и инфраструктуру, - в результате процветали, в то время как другие не только не смогли воспользоваться всеми преимуществами, но и в некоторых случаях оказались в худшем положении. Таким образом, лучшее понимание точной применимости каждого типа ML и его последствий для конкретных задач имеет решающее значение для понимания его вероятного экономического воздействия ».

Первоначально опубликовано на blog.irvingwb.com 23 июля 2018 г.