Автоматизация эстетического суждения

N.B. Это доклад для конференции, который я написал в апреле. Таким образом, некоторые ссылки на быстро развивающуюся область компьютерных наук уже несколько устарели, однако более широкая теория все еще может представлять интерес. Это часть более широкого проекта по «реалистичности», который я планирую начать в следующем году, когда защитю докторскую диссертацию.

Вы, вероятно, задаетесь вопросом, должны ли вы знать, кто эта женщина выше, поскольку я представляю ее фотографию без ясного контекста. Возможно, вам уже некомфортно из-за этичности этой презентации: знает ли она, что я использую ее изображение? Я молчаливо приглашаю вас вынести какое-то суждение о ее внешности? Однако это образ человека, которого нет и никогда не было. Это не фотография и не фотошоп, а оригинальное изображение, созданное с помощью «генеративно-состязательной сети», относительно новой техники машинного обучения.

Если вы вообще судите об этом лице, сейчас, вероятно, речь идет о степени его «реалистичности» — термин, который не придет на ум в отношении «настоящей» фотографии. Даже если вы действительно считаете это реалистичным, взгляд этого «фальшивого» человека в глаза может вызывать тревогу. Но почему?

Подходя к медиатехнологиям с точки зрения гуманитарных/литературных исследований, мне интересно, как они регистрируются на якобы нетехнических уровнях опыта. В этой статье я рассмотрю, как генеративно-состязательные сети, или «GAN», могут повлиять на то, как и почему мы оцениваем вещи как «реалистичные». Я начну с определения термина «реалистичный» как категории «эстетического суждения». Затем я расскажу, что такое GAN и что они делают. Наконец, я предполагаю, что растущее использование GAN может открыть новое значение для термина «реалистичный».

Эстетическая оценка

Немецкий философ восемнадцатого века Александр Баумгартен ввел термин «эстетика» для изучения aistheta — «объектов чувств» — а не noeta — или «объектов мысли». ¹ В своем труде по эстетике Иммануил Кант замечает, что описания вещей как «прекрасных» или «возвышенных» вытекают из субъективного опыта, но тем не менее маскируются под универсальные. Итак, если я называю картину «красивой», я предполагаю, что вы тоже находите ее красивой. Кант утверждает, что это происходит потому, что такие суждения — если они сделаны искренне — «бескорыстны». Я не вписываю картину в какие-то заранее существовавшие концептуальные рамки, чтобы оценить ее. Оно уже как бы унифицировано само по себе. Таким образом, эстетические суждения — это способы, которыми мы концептуализируем и сообщаем об объектах, которые кажется воздействовать на нас извне нашего концептуального мышления.

Эстетическая философия уже давно изменила несколько напыщенным, европоцентристским представлениям о «прекрасном» и «возвышенном». В более поздних работах задокументировано, как эти суждения структурируются и реструктурируются через социальные институты и обычаи (и заложенные в них властные отношения). Также больше внимания уделялось более «второстепенным» категориям эстетических суждений, таким как «круто», «мило» и «интересно». В отсутствие высокомерия «красивого» эти категории помещают эстетику за пределы галереи и, как пишет Сианна Нгай, подчеркивают — цитата — «постоянство и повседневность нашего эстетического отношения к часто искусно разработанным, упакованным и рекламируемым товарам, которые нас окружают. в наших домах, на наших рабочих местах и на улице».³

Реалистичный

Одной из выдающихся эстетических категорий сегодня является «реалистичная». Это слово отличается этимологическим отношением к философскому реализму в Германии конца 18 века, когда поэты-романтики Шиллер и Гёте использовали realistischдля критики кого-то, тоже > погрузиться в неважные детали реальности,чтобы уловить идеальнуюистину и красоту. Однако, с господством буржуазного искусства и политики в Европе, «реалистичный» стал положительным термином для оценки как произведений искусства, так и людей как скромных, прагматичных и революционных людей.⁴

В сегодняшней западной культуре мы оцениваем произведения искусства как «реалистичные» по-разному. В своем продолжающемся исследовании я сгруппировал их по трем свободным, частично совпадающим подкатегориям. Очень кратко: «эмпирически» реалистичные произведения искусства выглядят или ощущаются как нечто реальное, но не обязательно представляют реальные вещи; «репрезентативно» реалистические произведения как бы адекватно отражают разнообразные детали действительности, избегая стереотипов, «обнажая» то, что часто упускается из виду; наконец, «интуитивно» реалистичные произведения искусства изображают серию событий, которые кажутся правдоподобными, будь то в реальности или в соответствии с подразумеваемыми законами вымышленного мира.

В каждом случае «реалистичный» означает способность представления воздействовать на нас извне рационального мышления. События в фильме «кажутся» реалистичными, как будто они «могут» произойти. Но я не могу проверить это в тот момент. Я не могу узнать для определенного. Я сужу о чем-то реалистичном в отсутствии уверенности, маскируя свою уязвимость и ограниченность своих знаний под согласием. Между тем я оцениваю что-то «нереалистично», чтобы утверждать, что это нена меня по-прежнему влияет.

От камеры-обскуры до фотографии художники уже давно обращаются к технологиям, чтобы сделать свою работу более «реалистичной». В начале двадцатого века Вальтер Беньямин писал, что фотография создает в нас «оптическое бессознательное», позволяющее нам анализировать и воспроизводить более тонкие, мельчайшие детали визуального мира. Сегодняшние алгоритмы «машинного обучения» аналогичным образом расширяют наши возможности. Они выявляют закономерности в большом количестве записанных данных, которые еще не были «структурированы» человеком. Таким образом, они делают огромные объемы «больших данных» полезными без участия человека или группы людей, пытающихся выполнить невыполнимую задачу их просеивания.

Работая на скоростях и в масштабах, выходящих за пределы возможностей человеческого познания, эти алгоритмы могут показаться неспециалисту демонстрацией таинственной силы, наблюдающей и управляющей невидимой структурой реальности невидимыми способами.

Генеративно-состязательные сети (GAN)

Генеративно-состязательные сети, изобретенные Яном Гудфеллоу в 2014 году, быстро улучшили свою способность создавать реалистичные изображения. Рассмотрим, например, изображения автомобилей, сгенерированные GAN выше.

Однако это не означает, что все изображения, сгенерированные GAN, идеальны.

GAN состоят из двух «нейронных сетей»: «генератора» и «дискриминатора». Первоначально генератор отправляет случайную проекцию данных на дискриминатор. Дискриминатор сравнивает это с существующим набором данных, чтобы получить оценку вероятности того, являются ли сгенерированные данные «настоящими» или «фальшивыми». Затем генератор оптимизируется для получения данных, которые возвращают лучшую оценку вероятности. Между тем, дискриминатор также настроен, чтобы стать более проницательным. Таким образом, эти двое соревнуются: генератор создает лучшие изображения кошек, чтобы обмануть дискриминатор, который постоянно улучшает свои общие знания о том, как выглядит кошка.

Примечание. Вы можете увидеть это в базовой форме, используя GANLab Технологического института Джорджии (зеленые точки представляют существующие данные из обучающего набора, фиолетовые — данные, сгенерированные генератором, эпоха — количество раз, когда дискриминатор просматривает существующие данные).

В репортажах о GAN часто высказывались предположения об их способности вводить в заблуждение ничего не подозревающую публику. Внедрение «глубоких фейков» в 2017 году вызвало более широкую озабоченность по поводу потенциального использования GAN для создания «фейковых новостей». В видеоролике BuzzFeed, выпущенном в 2018 году, использовалась GAN, чтобы показать, как президент Обама называет президента Трампа — цитирую — «полным и полным придурком», а затем предупреждает зрителей — цитирую — «полагаться на надежные источники новостей».⁶

Эта озабоченность связана с часто упоминаемым фактом, что алгоритмы — и особенно нейронные сети — имеют тенденцию быть «черными ящиками». Обе сети в GAN имеют «скрытые уровни», взаимосвязанные действия которых понятны людям только через их конечные результаты. Когда они генерируют реалистичные изображения, две сети идентифицируют и воспроизводят шаблоны в визуальных данных, которые мы сами не можем. Эта динамика, в которой машинное обучение работает внутри «запредельного», к которому мы не можем получить доступ, — это то, за что я борюсь в своем названии: «Автоматизация эстетического суждения».

Как я уже говорил, эстетическое суждение — это субъективное утверждение, маскирующееся под объективное. Признание этого может быть проблематичным для инженеров, конкурирующих в условиях технокапитализма за создание наиболее реалистичных изображений, сгенерированных GAN.⁷ Они часто замыкают круг, рекламируя процент испытуемых, «одураченных» сгенерированными ими изображениями.

Однако там, где это слишком медленно или дорого, многие использовали автоматические метрики, чтобы измерить, насколько «реалистичны» их изображения. Типичным примером является «начальное расстояние Фреше», в котором используется предварительно обученный алгоритм машинного обучения для сопоставления сгенерированных изображений с существующим набором данных⁸. вопрос о том, что означает «реалистичный» в качестве цели. Эти инженеры обслуживают человеческую аудиторию или добывают данные для реальности, за пределами человеческого восприятия?

В статье Матье, Купри и Лекуна за 2016 год, описывающей GAN для прогнозирования будущих видеокадров на основе существующей последовательности, утверждается, что последовательность, которую она создает, «в долгосрочной перспективе не похожа на что-то близкое к истине, но остается реалистичной». .⁹ Это утверждение перекликается с ранним описанием фильма Жаном Кокто как «реалистичным документальным фильмом о нереальных событиях» в Le Sang d'un Poète.¹⁰ Однако Мэти Купри и ЛеКун делают это заявление, потому что их последовательность получает высокие баллы по параметрам «Отношение пикового сигнала к шуму» и «Индекс структурного подобия». Таким образом, они оценивают продукт GAN как реалистичный, поскольку он соответствует критериям других алгоритмов, а не людей.

Гиперреализм

Как мы, неспециалисты, можем судить об изображениях, сгенерированных GAN, когда сталкиваемся с ними за пределами лаборатории? Возможно, правильнее будет описать эти изображения как «гиперреалистичные», чем как «реалистичные». Поскольку дискриминатору GAN обычно подаются фотографии, сгенерированные изображения приближаются к условностям фотографического среды, а не к самому человеческому визуальному опыту. Таким образом, их эффект можно наиболее остро ощущать при повседневном взаимодействии с фотографиями.

Фотографии иллюстрируют то, что Чарльз С. Пирс называет «индексными знаками» — знаками, которые мы интерпретируем как свидетельства того, что они означают.¹¹ Фотография традиционно понимается как свидетельство того, что изображенное на ней произошло, даже если это выступление. Как сказал Ролан Барт: «Каждая фотография — это свидетельство присутствия».¹²

Совсем недавно Стивен Принс указал на усовершенствования CGI, чтобы доказать, что цифровые изображения имеют другую, более «гибкую» онтологию.¹³ Они не являются индексальными, но, тем не менее, их можно считать экспериментально реалистичными, поскольку они тщательно аппроксимировать пространственную информацию реальности в их освещении и затенении.

В момент, когда мы смотрим на лицо хорошего качества, сгенерированное GAN, мы не можем применить меру, чтобы знать, что мы не смотрим на фотографию не реального человека.

Если, как пишет Барт, фотографии поражают нас своим поразительным и самоочевидным заявлением о захвате реальности — то, что он называет punctum фотографии, — то и изображения, сгенерированные GAN, тоже поражают.¹⁴ Даже когда мы зная, что они «поддельные», лица воздействуют на нас как минимум подобно фотографиям реальных людей. По-прежнему трудно полностью отделить фотографию от ее референта: нас преследует кто-то, кто визуально присутствует, но экзистенциально отсутствует.

Однако, если бы мы были завалены сгенерированными GAN лицами — например, в качестве дешевой альтернативы моделям в рекламе — разве мы не стали бы сверхосознавать потенциал не -индексальность каждой фотографии, которую мы видим? Не испытаем ли мы общее ослабление punctum?

Ужасно реалистично

Смотреть в глаза сгенерированному GAN лицу может быть неприятно. Мы оцениваем его как «реалистичный», но можем также обратиться к другой эстетической категории: «жуткий». Марк Фишер пишет, что мы обнаруживаем жуткость в ландшафтах, лишенных человеческого присутствия, когда изо всех сил пытаемся определить местонахождение агентов и оказываемся — цитирую — «пойманными ритмами, импульсами и паттернами нечеловеческих сил». начните рекомендовать вещь, которую мы один раз упомянули в тексте, другу. Жуткость подчеркивает скрытые силы, действующие в приземленной реальности.

Затем мы могли бы добавить в наш список четвертый тип реалистичности: «ужасно реалистичную». Мы оцениваем фотографии, созданные GAN, как реалистичные, хотя и ужасно. Если бы все фотографии встречались таким образом, мы бы осознали уязвимость, лежащую в основе наших эстетических суждений.

Устрашающе реалистичное заставляет нас осознать, каким образом вымышленные представления, подкрепленные возникающими технологическими инновациями, могут обойти нашу «рациональную» защиту и сохранить то, что ощущается как нечто, что мы уже «знать”. Таким образом, вместо того, чтобы обмануть нас, жутко реалистичные образы выдвигают на первый план собственное развертывание и могут непреднамеренно ниспровергнуть обращение к «реалистичности» как к одной из постоянно меняющихся конечных целей технокапитализма.

[1] Пол Гайер, Немецкая эстетика 18-го века, Стэнфордская философская энциклопедия, 16 января 2007 г., редакция от 3 марта 2014 г. ‹ https://plato.stanford.edu/entries/aesthetics-18th. -немецкий/»› [по состоянию на 30 марта 2019 г.]

[2] Иммануил Кант, Критика суждения, пер. Джеймс Крид Мередит (Оксфорд: Clarendon Press, 1952), с. 314.

[3] Сианна Нгай, Наши эстетические категории: забавные, интересные, милые (Кембридж, Массачусетс: издательство Гарвардского университета, 2012), с. 58.

[4] Вольфганг Кляйн, «Realismus / Realistisch», Ästhetische Grundbegriffe, Vol. 5, изд. Карлхайнца Барка (Штутгарт/Веймар: Metzler, 2003), стр. 149–197.

[5] Вальтер Бенджамин, «Маленькая история фотографии», Walter Benjamin: Selected Writings, vol. 2, пт. 2, 1931–1934, пер. Родни Ливингстон и др., изд. Майкл У. Дженнингс, Ховард Эйланд и Гэри Смит (Кембридж, Массачусетс: Белкнап, 1999), стр. 507–530 (стр. 510–11)

[6] BuzzFeedVideo, Вы не поверите, что Обама говорит в этом видео 😉, YouTube, 17 апреля 2018 г. ‹https://www.youtube.com/watch?v=cQ54GDm1eL0 › [по состоянию на 30 марта 2019 г.]

[7] Луис Суарес-Вилья определяет технокапитализм как новую эру капитализма, в которой доминирующим способом производства является товаризация нематериальных качеств человеческого творчества посредством исследований и разработок новых технологий. См.: Луис Суарес-Вилья, Технокапитализм: критический взгляд на технологические инновации и корпоративизм (Филадельфия: издательство Temple University Press, 2012), стр. 3–4.

[8] Мартин Хойзел и др., GAN, обученные с помощью двух правил обновления временной шкалы, сходятся к локальному равновесию Нэша, arXiv, 12 января 2018 г. ‹ https://arxiv.org /abs/1706.08500› [по состоянию на 30 марта 2019 г.], с. 6.

[9] Майкл Матье, Камиль Купри и Янн ЛеКун, Глубокий многомасштабный прогноз видео за пределами среднеквадратичной ошибки, arXiv, 26 февраля 2016 г. ‹https://arxiv.org/pdf/1511.05440 › [по состоянию на 30 марта 2019 г.] (стр. 13)

[10] Песнь поэта, реж. Жан Кокто (Шарль де Ноай, 1930)

[11] Чарльз С. Пирс, «Пролегомены к апологии прагматизма», в Пирс о знаках: труды по семиотике Чарльза Сандерса Пирса, изд. Джеймс Хупс (Чапел-Хилл, Северная Каролина: North Carolina Press, 1991), стр. 249–252 (стр. 251)

[12] Ролан Барт, Camera Ludica: Reflections on Photography,пер. Ричард Ховард (Нью-Йорк: Hill and Wang, 1981),стр. 87.

[13] Стивен Принс, «Правдивая ложь: реализм восприятия, цифровые изображения и теория кино», Film Quarterly, 49.3 (весна 1996 г.), 27–37 (стр. 29–30)

[14] Барт, Camera Ludica, стр. 26–27.

[15] Марк Фишер, The Weird and the Eerie, 3-е изд. (Лондон: Repeater Books, 2016), с. 11.

Автоматизация эстетического суждения

Вопросы по теме