Мои первые несколько недель в ACMI были вихрем открытий, исследований, планирования и волнения в связи с его предстоящим обновлением. Один из моих проектов - продолжить изучение машинного обучения и связанных с ним методов искусственного интеллекта в коллекции австралийских движущихся изображений ACMI.

Это не тот проект.

Или, если это так, то это скорее увлекательная часть проекта, позволяющая выпустить пар. Опираясь на эксперимент Дэна Хона по созданию британских географических названий, я обучил рекуррентную нейронную сеть (RNN) на заголовках из коллекции ACMI и попросил ее сгенерировать еще несколько.

Метод

Я использовал инструкции Джеффа Томпсона для OS X, чтобы заставить torch-rnn работать, обучаться и предсказывать новые названия на моем Mac. Хороший способ сказать, что вы работаете с новейшими технологиями, - это то, что их сложно установить. Мне не нужно было много редактировать текстовые файлы, чтобы заставить его работать, и это не сломало многие другие вещи, но в следующий раз я обязательно попробую Docker версия первая. Мораль такова: держите свой ИИ в надежном месте!

Следующим шагом было получение списка титулов для обучения ИИ. Я взял файл объектов из стартового комплекта ACMI Collection Data Starter Kit и написал быстрый скрипт Python для записи заголовков в текстовый файл. Вот полный список, если интересно.

Обучение названиям на моем ноутбуке заняло около часа - я не задерживался, чтобы точно узнать, сколько времени. Интересно, что в процессе обучения создаются файлы «контрольных точек», которые можно использовать для создания заголовков на основе менее опытной сети до завершения обучения. Я приведу несколько примеров названий из этих контрольных точек ниже.

По окончании обучения создавать заголовки стало несложно. Также возможно предоставить различные значения «температуры», которые изменят количество «новизны» в системе. В приведенных ниже примерах я исследую эффекты большего количества тренировок и меньшего количества новинок. Результаты, которые я выделил, (потому что я их выбрал) улучшают среднее качество результатов. В самых интересных сценариях я использовал более длинные списки результатов.

Эффект от большего количества тренировок

Эти команды генерации различаются в зависимости от контрольной точки. Более высокое число означает, что сеть более обучена, и наибольшее число составляет 17150.

th sample.lua -checkpoint cv/acmititles_1000.t7

Это довольно примитивно - почти «lorem ipsum», но явно лучше, чем случайные символы, и я даю ему дополнительные баллы за изобретение «Австралиации». Он также принял протоколы ACMI для маркировки титров и DVD в заголовках. Мне нравится, что это порождает бессмыслицу, связанную с определенным языком - английским, немецким, французским, латинским. (Примечание. ACMI использует знак «=» для обозначения переведенных названий. Преобразование «Нет» в «№» - это Medium.)

  • Дишорл (Коптир. Волуку (с субтитрами))
  • Brainou dinawawd Spiture conzer
  • Fing, вызовите колодец
  • Франция Fogral 2000 = Cray
  • Река подходит
  • Wildisifs Taby's Issoder wald. №1. [Бездействие. - 0t = Clactione (A)
  • Мамсон из Cames Afrerzand из трех муравьев A Blad York & ukou [DVD]
  • Глаз
  • Австралия ru
  • Cellle que dreacuat: Truciona Schore [CVCA)
  • Chaples of the Suny
  • Штукатурка Циттрест
  • Ут-лензунес Зреал Стире Туран
  • …и т.д.
th sample.lua -checkpoint cv/acmititles_5000.t7

Теперь похоже, что в него вложили какую-то мысль. Может быть полезно представить, что некоторые из них произносятся на старом шотландском диалекте:

  • Черная Австралия
  • Играть в шорк
  • Знаменитость трона: Христос в завтрашний день
  • Frin ’of Guitz dous
  • Военный кариес
  • вид мечты
  • Строит томный король укроп-хвастун. Приходи читатель из Беринга
  • К югу от излучин
  • Куман уходит: Poopes с Доном в Виглемборти
  • Город Cundrals
  • Fackumo
  • Cat Critics: thrawd unges, the changlosia comafrico: отправлено в кино
  • Альфонт
  • Речь
  • Не время (D)
  • Lonster = Запад Таве
  • Chysids: джинутион в лугаре
  • …и т.д.
th sample.lua -checkpoint cv/acmititles_10000.t7

Эта модель, кажется, имеет более длительные моменты нахождения на грани осмысления. Я думаю, что значение temperature все еще может быть слишком высоким, чтобы представлять интерес - слишком много случайности может быть так же скучно, как и ее отсутствие.

  • Крейнинг
  • Gromastard of Apprets (Подпись)
  • Пляж Германии
  • Преследуемый штрафом. [№381
  • Зеркало огня, подаренное Хистри Васи Миро Валлей [B&W]
  • Тенни - это ранний белый мармелад [DVD]
  • Небесные люди
  • Страна чудес Тада: битва Глейтера сабуте виториом
  • Муза и люди и эксперименты: проект баби
  • Сомнительный фильм!
  • Les Fluik Steagh: Prenstactic Rives для долгой жизни
  • Новый город. Часть 1. Спедите Нортан вук
  • Мамблер сама
  • …и т.д. Больше результатов здесь.
th sample.lua -checkpoint cv/acmititles_17150.t7

Это последняя модель после окончания обучения. Это довольно изобретательно - если бы мы знали, что означают все эти новые слова. Я называю это «режимом научно-фантастического романа для молодых взрослых».

  • Делая раздражительный
  • Зукбой
  • Звук пары
  • Остров Вижн
  • Nemplatage от speeng: чувство моря Ennital [Dabb)
  • Sourtelf asimation
  • Космический мир
  • История Бангосии в австралийской вечности
  • Современные принцы, лабон и кружево
  • Зайв и диджент
  • Anumie для редукционного вождения
  • Метрективал описывает голос = обезьяна: Эпизоды
  • …и т.д. Полный список здесь.

Эффект новизны

Помните, что эта нейронная сеть не знает английских слов, грамматики или пунктуации. Ему когда-либо показывались только эти заголовки, а не какой-либо другой текст, и мы не говорили ему, что это обязательно заголовки или даже слова.

Учитывая, как мало мы рассказали этому ИИ о том, что он должен делать (просто «делать больше таких вещей»), он выполняет замечательную работу. Он также довольно смел, когда идет в новом направлении. Возможно, немного слишком храбрый.

К счастью, есть temperature элемент управления, который позволяет нам охладить новизну (и, возможно, уменьшить любую возникающую чувствительность). Значение по умолчанию temperature - 1.0, т. Е. Самое новое, что мы и использовали до сих пор. Если набрать temperature назад, вы получите больше слов и словосочетаний, которые уже есть в обучающем списке. Проверить это:

th sample.lua -checkpoint cv/acmititles_17150.t7 -temperature 0.2

Очень низкая новизна - используемые выкройки являются наиболее распространенными в коллекции. Кажется, у нас много "рассказов" о работах.

  • Дети школы (TEFC)
  • Сообщество и история
  • Маленький мир сказки
  • Начало школы (TEFC)
  • Море и поиски моря
  • Рассказ истории
  • История поиска поиска поиска мира
  • Рассказ истории
  • …и т.д.
th sample.lua -checkpoint cv/acmititles_17150.t7 -temperature 0.5

Добавление новизны. В этих результатах большинство слов являются узнаваемыми английскими, и легче выбрать грамматически правильные заголовки. Я называю это «режимом названий альбомов с плохой концепцией». Мы близки к интригующему новизне, но шаблоны слов слишком повторяются («х в / из / и / в у»), чтобы долго интриговать.

  • Жизнь офиса
  • Сообщество растений
  • Разрушение земли = великий рост [DVD]
  • Тело в море одежды = История электронного исследования
  • Разделение отставников из семерки (с подписями)
  • Рассмотрение ритма
  • Австралийский дневник. №097 = Deutschland Spiegel
  • Дизайн командиру
  • Искусство в легком
  • Демонстр
  • Дети мондера и открытия
  • Музыкальная панстракция
  • Мастер Флеминации
  • Махинации и мир для духа общения
  • Панорама Странса. [№70 / 12]
  • … И т. Д. Вот еще 359.
th sample.lua -checkpoint cv/acmititles_17150.t7 -temperature 0.6

"Режим бакалавра художника". На этом этапе изменение temperature - это компромисс между желанием, возможно, большего новых шаблонов слов, но меньшего новых слов. Если бы мы относились к этому серьезно, возможно, мы бы выбрали модель, которая знает больше об (австралийском) английском языке.

  • Подборка поз
  • Мазуры выживания (K)
  • Города великих картин отца = Allial change
  • Кубок Anternation
  • Роза в мире
  • Новые части кота
  • Challenge de Billy
  • Как булочка с овечкой
  • Получатели истории
  • Толстый до трех смар
  • Бобовая история
  • Сага: убийца и обучение
  • Вода в индустриальной программе
  • История сердца
  • Слова баббера Юга
  • Семьи 1990 и 2
  • Новая жизнь в красном шоу
  • Ангел ветра
  • Оформление
  • Интервью самого себя и компиляции
  • Кровь движется
  • Зеркало Австралии
  • … И т.д. Вот еще 374.

Это все. Я буду исследовать эти концепции дальше в своем новом альбоме The Think of the Beat, который продается абсолютно в плохих музыкальных магазинах.