Искусственный интеллект (ИИ) и миф о том, что он убивает творческие способности

ScriptBook - это компания, занимающаяся искусственным интеллектом, миссия которой - помогать заинтересованным сторонам в создании развлекательных фильмов, предоставляя автоматизированный анализ сценариев и финансовые прогнозы. Наше видение - «революционизировать рассказывание историй с помощью искусства искусственного интеллекта». Благодаря машинному обучению, глубокому обучению и обработке естественного языка наше интеллектуальное решение обеспечивает поддержку прогнозируемых решений на основе данных от сценария до экрана. Наши алгоритмы прогнозирования основаны на сюжете и персонажах, чтобы точно предсказать коммерческий и критический успех кино и телевидения.

В этом сообщении блога мы рассматриваем одну из наиболее частых критических замечаний, которые мы получаем, а именно предполагаемую несовместимость компьютеризированных алгоритмов и творческого процесса человека.

До сих пор кинематографический бизнес скептически относился к идее анализа сценария компьютером, заявляя, что автоматизированный процесс не может уловить что-то столь же человеческое, как рассказ. Для многих из них идея о том, что их работа оценивается машиной, а не человеком, почти оскорбительна. Затем критика продолжается: если алгоритмы решают, какие сценарии будут создаваться - при условии, что вышеупомянутая критика верна, - тогда искусственный интеллект принципиально не сможет обнаружить алмазы в необработанном алмазе. Эта озабоченность понятна и, по сути, сводится к вопросу: в какой степени искусственный интеллект способны судить о творчестве человека?

В ScriptBook мы признаем, что компьютеры не могут испытывать эмоциональную реакцию при анализе сценария. При этом все, что мы можем сделать, - это выявить основные закономерности, вызывающие такие эмоциональные реакции, и, в конечном итоге, предсказать их, несмотря на отсутствие эмоций у машины. Во всяком случае, недавние успехи глубокого обучения в различных областях, таких как распознавание изображений, машинный перевод и т. Д., Дают веские аргументы в пользу этой точки зрения. Возьмем, к примеру, распознавание изображений [1, 2, 3, 4]. Здесь нейронная сеть получает плоский двумерный массив значений пикселей, которые кодируют изображение определенного объекта. Нейронной сети необходимо решить, какая из тысяч возможных категорий объектов является правильной. Мы, люди, можем интерпретировать картинку в контексте реального мира; мы знаем, как представить его в трех измерениях, мы понимаем связь между формой и функцией, и мы можем воспринимать движение за неподвижным изображением.

Нейронные сети и другие алгоритмические формы интеллекта не имеют доступа к этой информации, и тем не менее они соответствуют, если не превосходят, возможности человека в визуальных задачах. То, что им не хватает в контекстной информации, они более чем компенсируют огромным объемом данных, которые они могут усвоить во время обучения. Эта способность уже смогла победить людей в некоторых очень «человеческих» областях. Возьмем, к примеру, прошлогодний AI DeepStack, победивший людей в чисто человеческой игре в покер [5]. Это был абсолютный прорыв, потому что покер - это так называемая «игра с несовершенной информацией», в которой человеческая интуиция и психология играют решающую роль - два свойства, которые обычно не связаны с компьютерами.

Но как насчет повествования? Большие данные огромны. Хотя компьютер может быть не в состоянии уловить, почему мы находим определенный фильм увлекательным, он может сравнить сценарий этого фильма с очень большим набором данных других сценариев и провести параллели со структурами сюжетов в прошлых фильмах, которые были связаны с успехами или неудачами. Хотя мы не сомневаемся, что человек-читатель превзойдет компьютер в понимании тонкостей отдельного сценария, для людей будет очень сложно, если не невозможно, сравнить этот сценарий с десятками тысяч других. Столь же сложно объективно сопоставить содержание всех этих сценариев с финансовым успехом и успехом критиков, но именно в этом машины преуспевают. Читатель будет использовать человеческий подход; сочетание опыта и субъективного чутья. Внутреннее чутье, конечно, не обязательно является плохим предсказателем, но, безусловно, очень предвзято (см. Нашу предыдущую запись в блоге о гендерной предвзятости).

Что касается оригинальности, то истории принадлежали нашему виду с самого начала, и вопросы о том, как и почему изучаются в течение бесчисленных лет. Эти исследования показывают (подробный обзор см. В [6]), что истории, которые выдерживают испытание временем, как правило, имеют общие структурные элементы. Более того, как исследовал Жорж Полти в своей работе «Тридцать шесть драматических ситуаций» еще в 1895 году [7], все драматические ситуации в каждой истории могут быть возвращены к прототипу из списка из 36 различных ситуаций.

Отсюда следует, что даже оригинальные рассказы редко слишком сильно отклоняются от этого общего ядра. Структура и история неразрывно связаны, и структура может быть изучена искусственным интеллектом.

Пример использования: Get Out (2017 г.)

В качестве примера весьма оригинального сценария, который следует типичной структуре сюжета, рассмотрим фильм «Уходи», получивший премию «Лучший оригинальный сценарий» за лучший оригинальный сценарий 2018 года. Фильм начинается с подстрекательского инцидента, который создает загадку, которую необходимо разгадать. После этого, во время первого акта, мы знакомимся с главными героями и изучаем правила среды, в которой происходит история. Во втором акте все начинает распутываться. Главный герой, а через него и зрители начинают понимать, что не все так, как кажется. В середине фильма главный герой получает неожиданное предупреждение «Выходи!», Точка останова, после которой он больше не реагирует на свое окружение, а начинает действовать. Во время третьего акта наш главный герой попадает во все новые и новые проблемы, в конечном итоге достигая отчаянно низкой точки, в которой все кажется потерянным, после чего ему, тем не менее, удается перевернуть столы и выйти живым и невредимым. Это учебник. Что делает его таким оригинальным, так это обстановка и детали, а не структура.

Один из показателей, который мы прогнозируем для сценария фильма, называется «артистичность». Это показатель, который мы используем, чтобы различать фильмы, ориентированные на максимально широкую аудиторию (например, блокбастеры), и фильмы, которые, как ожидается, понравятся более узкой аудитории (например, артхаус).

При анализе сценария «Get Out» с помощью нашего ИИ и построении графика производственного бюджета в сравнении с художественностью, как показано на рисунке 1, мы видим, что наша система помещает «Get Out» немного больше в сторону «артхауса» шкалы. Обратите внимание, что производственный бюджет для «Get Out» - это наше прогнозируемое значение (реальное: 5 миллионов долларов, прогнозируемое: 6,5 миллиона долларов).

График также показывает, что при аналогичном производственном бюджете «Луна» 2009 года имеет немного более широкую привлекательность, в то время как «Отрочество» 2014 года нацелена на более избранную аудиторию. Аналогичным образом, «Люди, которые смотрят на козлов» нацелены на аналогичную аудиторию в соответствии с этим масштабом, но извлекают выгоду из значительно большего производственного бюджета.

Рисунок 1: Производственный бюджет и артистичность для «Get Out»

Пример использования: самый жестокий год (2014 г.)

Еще один интересный случай - 2014 год, получивший признание критиков как «Самый жестокий год». На этот раз вместо того, чтобы строить график производственного бюджета и артистичности, мы сравниваем наш прогнозируемый рейтинг аудитории (IMDB) (реальный: 7,0, прогнозируемый: 7,1). Результат изображен на рисунке 2.

Рисунок 2: Рейтинг аудитории и артистичность в «Самый жестокий год»

Мы видим, что нашему ИИ удается, основываясь исключительно на сценарии, признать, что «Самый жестокий год» определенно больше похож на такие фильмы, как «Ex Machina» и «Отель Grand Budapest», чем на «Темный рыцарь» или « Последняя станция ». Ясно, что сравнивать «Самый жестокий год» с «Темным рыцарем» не имело бы большого смысла, поскольку оба фильма явно различаются по привлекательности. Для человека это очевидно; не так с компом. Тем не менее наш ИИ научился делать это различие.

Это означает, что, несмотря на то, что наш ИИ не может быть эмоционально возбужден, он способен, во-первых, изучать шкалу, которая имеет смысл на человеческом, интуитивном уровне, и, во-вторых, размещать сценарий на этой шкале рядом с фильмами, которые имеют смысл, опять же. , на интуитивном уровне. Он делает это, несмотря на то, что не имеет представления о том, что такое «оригинальность», а вместо этого анализирует структурные элементы истории.

Заключение

Как указывалось выше, творчество имеет тенденцию следовать структуре. В ScriptBook мы не пытаемся подражать читателю. Скорее, мы извлекаем определяющие элементы истории (персонажи, структура, стиль диалога, взаимодействия, драматические события…) и представляем их в форме чисел. Нет ли в ScriptBook ошибок? Нет, но опять же, люди тоже. Типы ошибок, которые делает ScriptBook, в корне отличаются от тех, которые совершает человек, и основаны не на интуиции, а на усвоенных шаблонах. Во всяком случае, это делает его идеальным дополнением к человеческой интуиции.

[1] https://www.eetimes.com/document.asp?doc_id=1325712

[2] Кайминь Хэ, Сяньюй Чжан, Шаоцин Жэнь, Цзянь Сунь; Углубляясь в выпрямители: превосходя показатели человеческого уровня по классификации ImageNet, Международная конференция IEEE по компьютерному зрению (ICCV), 2015 г., стр. 1026–1034; Https://arxiv.org/abs/1502.01852v1

[3] Флориан Шрофф, Дмитрий Калениченко, Джеймс Филбин; FaceNet: унифицированное встраивание для распознавания лиц и кластеризации, Конференция IEEE по компьютерному зрению и распознаванию образов (CVPR), 2015 г., стр. 815–823; Https://arxiv.org/abs/1503.03832

[4] Мигель П. Экштейн, Кэтрин Кёлер, Лорен Э. Велборн, Эмре Акбас; «Люди, но не глубокие нейронные сети, часто пропускают гигантские цели в сценах», Current Biology Vol. 27, Issue 18, 2017, p2827–2832

[7] Моравчик, Матей и Шмид, Мартин и Берч, Нил и Лиси, Вильям и Моррилл, Дастин и Бард, Нолан и Дэвис, Тревор и Во, Кевин и Йохансон, Майкл и Боулинг, Майкл; «DeepStack: искусственный интеллект экспертного уровня в безлимитном покере», Science. 356. 10.1126 / science.aam6960, 2107

[6] Джон Йорк; «В лес: как работают истории и почему мы их рассказываем», Penguin, 2014 г.

[7] Жорж Полти; 36 драматических ситуаций, Париж, Mercure de France, 1895; Английский перевод 1921 года доступен бесплатно в Интернете по адресу https://archive.org/details/thirtysixdramati00polt