Визуальный тест Тьюринга

TLDR: Хотите узнать, сможете ли вы отличить человеческие картины от картин, созданных ИИ? Перейдите и пройдите тест здесь: https://forms.gle/Ayon9EvNZKvdkvZ68

Содержание

1. Что такое искусство?
2. Люди особенные?
3. Можно ли запрограммировать творчество?
4. Тест Тьюринга и его визуальная адаптация
5. Можно ли назвать подход Далл-и искусственным, поскольку он основан на человеческом творчестве?

"Заключение"

Фон

Дождливым вечером во время пасхальных каникул я решил, что могу оживить разговор за ужином, поговорив с семьей о захватывающей разработке ИИ. Будучи младшим братом, на мои плечи легло тяжелое бремя быть «технарем» — поэтому остальные члены моей семьи не самые техничные, а моя сестра — художница и в душе, и по профессии.

Алгоритм, о котором я с энтузиазмом говорил, был недавно выпущенной моделью Dall-e 2, которая могла создавать визуальное искусство, сравнимое с человеческим искусством.
Разговор зашел глубоко. в том, что составляет искусство и что делает нас особенными, и было сделано заявление, что глубина эмоций, которые передает человек-художник, будет отсутствовать в дизайнах, созданных ИИ, и поэтому может быть различима со 100% уверенностью.
Вы можете догадаться о моей мгновенной реакции на последнюю претензию: пришло время провести тест!

Ниже я расскажу о некоторых частях беседы, которые показались мне интересными, но я оговорюсь, отметив, что я не философ и не художник, и поэтому мой подход может быть скорее предвзятым в сторону инженерии.

1. Когда что-то становится искусством?

Для меня искусство — это сочетание опыта и эмоций.
Во-первых, эмпирический аспект кажется мне наиболее сильным, поскольку именно так я познакомился с искусством и как я в основном взаимодействую с ним. В частности, в детстве, когда моя мать читала мне историю, которую я мог себе представить, и «переживал» опыт, выходящий за рамки моей реальности, будь то основанный на чьей-то жизни или полностью воображаемый. В настоящее время я могу обогатить свой собственный жизненный опыт, читая, слушая, наблюдая и играя.
Другим аспектом является эмоциональный эффект, который может иметь произведение искусства. Независимо от определения какого-либо передаваемого опыта или понимания чувств или намерений художника, эмоция может возникнуть при представлении произведения. На мой взгляд, ключевое различие с эмпирическим аспектом заключается в степени руководства со стороны создателя:
- эмпирический: следует за историей или опытом и ведет нас по этому пути, где у нас могут быть небольшие отклонения в наших эмоциональных реакциях.
- эмоциональный: в гораздо большей степени зависит от личных обстоятельств, психического и эмоционального состояния

В этот момент вы можете начать думать: «Подождите секунду, эмоциональная реакция может относиться ко многим вещам вне искусства: это могут быть природные явления, люди, ситуации; неужели это не все искусство?». Я абсолютно согласен и поэтому утверждаю, что пропитанность человеческим опытом заслуживает большего веса в определении искусства. Так что же такого особенного в человеческом опыте?

2. У нас есть такие крутые вещи, как душа, сознание и творчество! Так что мы должны быть супер особенными! Верно? .. Верно?

Я так не думаю. По крайней мере, на мой взгляд, мы не такие уж особенные, и я не хочу показаться легкомысленным или циничным. Мой категорический ответ можно свести к предположению, что мы действительно сложная функция нашей биологии и окружающей нас физики, что влечет за собой полный детерминизм. Это означало бы, что нет особой силы, например, на каком-то духовном плане, за пределами того, что мы можем воспринимать в настоящее время, которая возвышает нас над биологическими функциями, о которых мы знаем. По общему признанию, мог быть особый феномен (т. е. душа или сознание), возникающий из сложности всех различных элементов, взаимодействующих на разных уровнях. Другими словами, может иметь место эмерджентное поведение, когда наша функция обработки реальности становится достаточно сложной. Наше ограниченное понимание мозга и его функций еще больше увеличивает вероятность существования некоторых черт, характерных для человека.

Тем не менее исторически мы продолжали ошибаться в том, что наши ошибочные антропоцентрические убеждения наделяют нас особым статусом. От того, чтобы быть выше царства животных, до того, чтобы быть в центре нашей солнечной системы / вселенной, благодаря дальнейшим исследованиям и исследованиям мы научились лучше знать. В целом, особенно когда речь идет об искусстве, я придерживаюсь мнения, что переживания и эмоции определяются чрезвычайно большим количеством параметров, но, тем не менее, являются детерминированными.

3. Можно ли запрограммировать творчество?

Наша детерминированная природа также имеет решающее значение для моего аргумента в пользу того, что у нас нет монополии на творчество. Креативность в самом простом определении — это нечто новое, может быть, яркое, может быть, неожиданное, но последнее часто бросается в глаза наблюдателю.

Как мы создаем что-то новое? Я бы сказал, что все новое, что придумывает человечество, будь то художественные движения или научные достижения, основано на нашем общем общем опыте и нашей истории. Каждое новое открытие или новый подход стоит на плечах тысячелетней разработки языка и концептуальных основ. На мой взгляд, это похоже на обучение большой модели машинного обучения, которая обычно впитывает более узкий набор (но значительно большее количество) человеческого опыта. Креативность может впоследствии возникнуть за счет внесения некоторой случайности, которая похожа на немного различное происхождение или обстоятельства художников, что привело к развитию ими уникального стиля. Тем не менее, все, что изображено в произведениях искусства, основано на знакомых нам объектах/явлениях и, следовательно, ограничено нашими сенсорными и когнитивными ограничениями (да, я игнорирую абстрактное искусство).

4. Тест Тьюринга и его визуальная адаптация

В двух словах, тест Тьюринга — это установка, в которой следователь-человек взаимодействует с другим человеком и ИИ, их цель — установить, какой обмен имеет человека на другом конце, имея доступ только к результатам их взаимодействия. В самых ранних экспериментах, проведенных Аланом Тьюрингом (который назвал это игрой в имитацию), это взаимодействие было основано исключительно на том, что текст был каналом для обмена информацией, то есть следователь использовал для общения только клавиатуру и видел ответы на экране.
Чтобы оценить Dall-e в этом сеттинге, нам нужно изменить экспериментальную установку, так как это не постоянный диалог, а скорее отдельные работы для оценки. Если бы мы провели параллель с текстовым тестом Тьюринга, это было бы эквивалентно просмотру отдельных предложений либо от людей, либо от алгоритма без постоянного контекста или цепочки. На мой взгляд, это значительно усложняет работу следователя, поскольку любое отклонение от контекста изображения или представлений о реальности может быть отнесено к творческому, причудливому художественному выражению. Экспериментальную установку можно было бы сделать похожей на исходную, если бы у нас был следователь, дающий подсказки и получающий рисунки в качестве ответов, однако это не могло быть в реальном времени, поскольку человеку потребовалось бы некоторое время, чтобы закончить свой рисунок.

Поэтому мы можем пойти с более простой экспериментальной установкой, рассматривая существующие работы и пытаясь определить их происхождение. С этой целью я собрал форму с несколькими изображениями, некоторые из них созданы Dall-e, некоторые — известными художниками. Ваша задача как следователя, если вы ее примете, состоит в том, чтобы решить одну за другой, исходит ли это от художника или от алгоритма. Как только будет достаточно заявок, я обновлю статью статистикой о том, как люди думали, что они поступали, и как они поступали на самом деле.

Викторина здесь: https://forms.gle/Ayon9EvNZKvdkvZ68

5. Можно ли назвать подход Далле искусственным, поскольку он основан на человеческом творчестве?

Модель Далл-и основана на потреблении огромных объемов информации, созданной человеком и помеченной человеком, с подсказка, которая служит отправной точкой для новых работ, также требующих творческого подхода.

С каждым из этих трех пунктов мы могли бы рассмотреть масштаб воздействия, а также методы, с помощью которых его можно уменьшить:
1. Созданные человеком изображения в обучающей выборке отражают наше понимание. и выражение окружающего мира. Чтобы заменить предвзятый/обогащенный обучающий набор, мы могли бы полагаться на захват и передачу алгоритму только фотографий (исключая фотографии картин), но даже это обосновывает искусство в реальном (потребуется относительно большой скачок, чтобы например сюрреализм). В качестве альтернативы мы могли бы просто генерировать синтетические изображения на основе совершенно случайных комбинаций пикселей. Между этими двумя крайностями мы можем представить шкалу, идущую от случайных значений пикселей через случайные комбинации изученных особенностей реальных концепций и вплоть до реальных фотографий. Независимо от уровня рандомизации, любой сгенерированный ввод потребует маркировки человеком, чтобы он в конечном итоге имел для нас какой-то смысл при создании из подсказки.
2. Маркировка человеком позволяет предоставлять текстовые подсказки для создания изображений, но можно представить, что могут быть лучшие представления полного набора функций, где часто у нас нет слов для представления вещей (например, у нас есть слова только для нескольких эмоций из широкого диапазона, который мы можем испытывать). ).[1] Однако взаимодействие на языке, не использующем слова, может быть затруднено: следуя примеру эмоций, мы могли бы использовать в качестве подсказки выражение лица, которое может быть богаче, чем набор слов, но может быть и ограничивающим. Со временем, если технология позволит точно считывать мозговые волны, мысли могут служить более точным и богатым отображением ярлыков.
3. Исходная подсказка для создания образов . Количество комбинаций слов, которые можно было бы использовать, выходит за рамки того, что мы могли бы исчерпывающе сгенерировать, а затем просеять, чтобы оценить, какие части мы находим интересными. Тем не менее, мы наверняка могли бы создать большую галерею изображений на основе популярных условий поиска изображений в Google, популярных закладок в литературных книгах или любых других существующих каталогов человеческой мысли. Конечно, это все еще несет в себе человеческую интуицию, и единственный способ полностью удалить это — это случайная генерация словосочетаний (или какая-то подобная эквивалентная операция случайной выборки пространства признаков [2])

Учитывая, что у нас есть варианты уменьшить роль человека в цикле обучения и творчества, я бы сказал, что мы можем рассматривать результаты как результат искусственного творчества, признавая при этом, что для того, чтобы любое из полученных произведений искусства имело для нас смысл, оно нуждается в некотором обосновании. наша воспринимаемая реальность.

Заключение

Я не собираюсь делать прогнозы о будущем искусства, просто хочу бросить вызов некоторому скептицизму в отношении медиа, созданных искусственным интеллектом, и его художественной ценности. Искусственные изображения могут вызывать эмоциональные реакции, часто кажущиеся отражающими человеческий опыт, и отображать новые комбинации понятий до такой степени, что это вряд ли отличимоеот человеческого искусства. Имея несколько способов уменьшить зависимость от человеческого участия в творческом цикле, я считаю полученные изображения искусством.

После выпуска алгоритма Dall-e 2 я был полностью поражен результатами, и по сей день я иногда задаюсь вопросом, не является ли все это ловкостью рук и то, что мы видим, на самом деле картины живых художников.

Технологии и наша изобретательность продолжают удивлять, и я с нетерпением жду следующей итерации искусства, созданного искусственным интеллектом!

Примечания

[1] — Мне любопытно, существуют ли алгоритмы, которые маркируют изображения со свободой действий за пределами предопределенного набора слов — некоторые выдуманные слова могут быть интересны.

[2] — о пространстве признаков: мне нравится представлять себе пространственное представление изображений, рассматривая измерение вдоль каждого слова. Например, в измерении собаки мы могли бы перейти от 0, когда нет признаков собаки, до 100, если на изображении явно изображена собака. Кошка будет иметь 100 баллов по измерению кошек, но также, вероятно, выше 0 по измерению собак, поскольку они имеют общее физическое сходство, то есть черты.

Авторство: некоторые из приведенных выше изображений взяты из xkcd, а изображения, использованные в викторине от Dall-e, были одобрены для этого использования.