Экспериментальный конвейер искусственного интеллекта для интеграции латерального мышления в вычислительные инструменты архитектуры.

Переход архитектурных инструментов от традиционных к современным вычислительным был сосредоточен на эффективности и производительности. Это связано с тем, что многие вычислительные инструменты, используемые архитекторами, унаследованы от промышленных дисциплин, таких как автомобилестроение и производство. CATIA, например, программное обеспечение, используемое Фрэнком Гери и его командой для создания сложных конструкций, изначально было разработано для авиационной промышленности.

В результате того, что они были унаследованы от этих областей, ценности и стандарты этих других дисциплин незаметно проникли в архитектуру. Следовательно, понятия оптимизации, стандартизации и эффективности, все качества вертикального мышления или рассуждения индустриальной эпохи, неизбежно имеют приоритет в этих инструментах над качествами латерального мышления, такими как неточности, неопределенность и случайности, качествами, часто связанными с художественными практиками.

Тем не менее, как говорится в работах таких ученых, как Брайан Лоусон, Найджел Кросс и Кис Дорст, существует четкая связь между творчеством и совершенством дизайна. Их работа указывает на то, что успешный архитектурный дизайн должен иметь творческие процессы проектирования и что этот творческий процесс проявляется в способности дизайнера сбалансировать дивергентное и конвергентное мышление — с дивергентным мышлением, тесно связанным с «латеральным мышлением», термином, придуманным Эдвардом де Боно. Такой творческий процесс проектирования часто приводит к неожиданным дизайнерским возможностям.

Следовательно, по мере того, как наши инструменты становились все более и более цифровыми, функции и методы, навязанные этими инструментами, которые в значительной степени сосредоточены на вертикальном мышлении, автоматически и непреднамеренно ограничивали возможное пространство дизайна.

Эта статья нацелена на необходимость повторной интеграции стратегий латерального мышления в инструменты архитектурного проектирования. Мы утверждаем, что сегодняшние вычислительные инструменты, которым не хватает этих специфических качеств, могли бы выиграть от внедрения искусственного интеллекта на ранних этапах процесса архитектурного проектирования в качестве метода применения подходов латерального мышления в наших процессах. В частности, мы представляем управляемый искусственным интеллектом четырехэтапный конвейер, основанный на генеративно-состязательных сетях (GAN), который опирается на возможность доступа к скрытому пространству машины и использования этого пространства в качестве экспериментальной цифровой среды для проектирования трехмерных архитектурных структур.

Похожая работа

Архитектурные инструменты за последнее десятилетие или около того в основном были сосредоточены на параметрических подходах. Эти подходы характеризуются присвоением значений отношениям между элементами и манипулированием этими значениями для контроля и организации этих отношений. С другой стороны, алгоритмы машинного обучения работают, исследуя данные и выявляя в них закономерности, не полагаясь на заранее определенные уравнения в качестве моделей. Несколько архитекторов и исследователей недавно изучили потенциал алгоритмов машинного обучения, в частности генеративно-состязательных сетей (GAN), в улучшении творческих возможностей. Эти алгоритмы GAN могут статистически изучать и имитировать любое распределение представленных им данных и обычно используются для генеративных целей.

Предсказуемые результаты

Хуанг и др. применил GAN для распознавания и создания архитектурных чертежей. Авторы использовали pix2pixHD, модифицированную GAN, которая изучает данные изображений попарно и генерирует новые изображения на основе входных данных. Они использовали схемы комнат, отмеченных разными цветами, в качестве исходных данных для создания планов квартир. Чанг и др. предложил генеративную состязательную сеть с ограничениями по графу для автоматического создания нескольких вариантов планировки дома из архитектурных пузырьковых диаграмм.

Эти работы наглядно демонстрируют потенциал и способность сетей GAN создавать архитектурные планы и, возможно, оптимизировать архитектурные процессы и рабочие процессы. Результаты принимаются в зависимости от того, насколько они знакомы или похожи на текущее состояние архитектуры. Следовательно, с точки зрения подходов латерального мышления, эти методы не работают хорошо, поскольку их результаты всегда довольно предсказуемы, ожидаемы и ограничены тем, что уже известно.

Тем не менее, как утверждает Филипп Морель, «задача любого архитектора заключается не в том, чтобы использовать компьютеры для воспроизведения или автоматизации того, что уже было придумано и создано, а в том, чтобы позволить компьютерам раскрыть совершенно новую форму архитектурного интеллекта». Он уточняет, что «Машины […] логически должны породить некую архитектуру, которая также выходит за рамки наших обычных возможностей», и заявляет, что такую ​​архитектуру еще предстоит создать. Наша работа направлена ​​на то, чтобы расширить это и позволить машине раскрыть новый тип «немыслимой архитектуры».

«Задача любого архитектора не в том, чтобы использовать компьютеры для воспроизведения или автоматизации того, что уже было придумано и произведено, а в том, чтобы позволить компьютерам раскрыть совершенно новую форму архитектурного интеллекта».

Непредсказуемые результаты

Chaillou предложил подход использования вложенных моделей GAN для создания всего многоквартирного дома. Используя этот метод, автор демонстрирует, как вложение различных моделей приводит к уникальным результатам и новым архитектурным стилям, которые находятся между известными в настоящее время стилями. Хотя такой подход показывает отличные результаты, процесс по-прежнему включает в себя тщательное изучение пар изображений для обучения.

Наша работа основана на этом массиве исследований и предлагает ряд шагов и подходов, с помощью которых мы обсуждаем потенциал латерального мышления на основе ИИ в архитектурных инструментах.

Методология

Мы предлагаем конвейер для создания 3D-структур, который использует StyleGAN и исследует свое скрытое пространство как 512-мерную виртуальную среду для проектирования. Скрытое пространство — это n-мерное пространство, где после обучения модели GAN генератор этой модели учится. чтобы сопоставить точки в этом пространстве с конкретными сгенерированными изображениями, похожими на изображения набора данных, на которых он был первоначально обучен. Эти сопоставления меняются каждый раз, когда модель обучается.

Скрытое пространство имеет структуру, которую можно запрашивать и перемещаться, где каждая точка в этом пространстве представляет собой вектор 512D, представляющий изображение. Наш четырехэтапный процесс основан на возможностях и свойствах этого пространства для проектирования трехмерной структуры. (1) Сначала он состоит из инициализации этого виртуального скрытого пространства точек посредством обучения модели StyleGAN. (2) Следующим шагом является вход в это пространство и доступ к его измерениям путем выбора или создания вектора 512D, представляющего изображение. (3) Далее, получив точку (изображение), мы перемещаемся по пространству, используя векторные арифметические операции и интерполяции для генерации новых точек, которые транслируются в изображения. (4) Наконец, мы создаем воксельную трехмерную структуру, используя значения пикселей этих изображений. Мы демонстрируем этот конвейер и предлагаем, как он может использовать архитектурные цифровые инструменты для экспериментов.

Виртуальная среда представляет собой пространство цифрового проектирования, в котором архитекторы в настоящее время проектируют, анализируют, редактируют и создают трехмерные структуры. Текущие используемые инструменты, такие как Rhino3D, сосредоточены на орфографических подходах и полагаются на кривые, линии, поверхности, NURBS и т. д., а также на манипулирование этими элементами для создания проектов в виртуальном 3D-пространстве. В этой статье мы вместо этого инициализируем виртуальную среду проектирования 512D посредством обучения машины и предлагаем различные подходы к проектированию в этом пространстве.

I. Инициализация виртуальной среды

Для инициализации виртуальной среды модель StyleGAN обучается на 5000 архитектурных планах, взятых из нескольких различных онлайн-источников, таких как ArchDaily и Artstor. Собранный набор данных состоит в основном из планов жилья разных стилей и периодов. Это позволяет лучше контролировать возможные функции изображения, которые машина может изучить. После обучения создается скрытое пространство 512D, в котором точки данных (представляющие изображения) с похожими характеристиками размещаются ближе друг к другу в этом пространстве. Мы используем эту сгенерированную «виртуальную среду» в качестве площадки для поиска и проектирования дизайнерских возможностей.

II. Выход в космос

Следующий шаг – вход в это пространство. Мы получаем доступ к размерам этого скрытого пространства, используя два основных метода: через генерацию точек, путем случайного использования набора значений для 512-мерного вектора (изображения) или путем встраивания изображения рисунка, выбранного или созданного пользователем.

В первом методе машина проходит через скрытое пространство и генерирует изображение, соответствующее заданным значениям вектора. Во втором методе может использоваться алгоритм встраивания StyleGAN, при котором машина сопоставляет встроенное изображение с определенной точкой в ​​пространстве, ближайшей к изображениям, имеющим схожие характеристики.

III. Навигация по космосу

После создания или выбора точек в этом пространстве мы используем эти точки в векторных арифметических операциях для создания новых точек, которые затем преобразуются в изображения. Чтобы проиллюстрировать это, добавляя векторы, мы комбинируем разные точки пространства с разными характеристиками и создаем новую точку. В частности, с точки зрения архитектурных планов, добавляя разные точки (векторы изображений) в пространстве, мы добавляем векторы, которые соответствуют планам с различными атрибутами и, возможно, стилями в архитектурном дизайне, в зависимости от исходного набора данных. Это позволяет целенаправленно, но непредсказуемо генерировать изображения. На рисунке ниже показан один из этих выходов в нашем процессе.

Более того, помимо объединения векторов, мы линейно интерполируем между двумя или более точками. Интерполируя от одной точки к другой, мы создаем серию трансформационных или переходных изображений с разным количеством шагов или степеней сходства, как показано на рисунке ниже.

IV. Генерация трехмерных вокселизированных структур

Наконец, чтобы создать 3D-формы, мы складываем серию изображений, сгенерированных в Z-пространстве, и создаем воксельную структуру. Для этого на этом этапе значения пикселей интерполированных изображений считываются и переводятся в трехмерный массив логических значений, которые определяют сплошной объем вокселей.

Эта сгенерированная виртуальная среда (скрытое пространство) служит альтернативой среде наших текущих вычислительных инструментов, таких как Rhino и AutoCAD. Работа в пространстве машины сама по себе создает новые предубеждения. Тем не менее, мы утверждаем, что текущие «механистические» операции, обычно выполняемые в текущем программном обеспечении для 3D-моделирования, такие как нарезка, лофтинг, обрезка и т. д., дают относительно предсказуемый результат, следуя ряду шагов и правил.

Однако с помощью нашего интегрированного непоследовательного и нелогического конвейера и методов направленной навигации в скрытом пространстве мы стремимся уйти от устоявшихся методов манипулирования кривыми, линиями и поверхностями наших инструментов и перейти к работе с векторными арифметическими операциями и пиксельными и воксели как строительные блоки как подход к латеральному мышлению. Такой подход может открыть новые возможности для дизайна и вдохновить на новые пространственные и формальные концепции. Кроме того, в этом процессе машина действует как активный участник проекта, а не просто как средство для достижения цели. Мы продемонстрируем это в следующем разделе на серии уникальных трехмерных форм, созданных с использованием 4 начальных начальных точек в скрытом пространстве.

Полученные результаты

Для тестирования нашего пайплайна мы выбираем 4 случайные точки (изображения планов: A, B, C, D) в сгенерированном скрытом пространстве и получаем их векторные представления. Затем мы тестируем 4 различных метода интерполяции и навигации между этими точками и генерируем в общей сложности 200 изображений, которые позже используем для создания трехмерных воксельных структур.

I. Метод навигации 1: равные отношения

В первом подходе мы проверяем влияние на сгенерированную форму изменения соотношений между двумя планами во время интерполяции. В качестве первого теста даем равные возможности обоим планам (50:50).

II. Метод навигации 2: неравные отношения

Во втором подходе мы меняем отношения точек в каждой интерполяции. Изменяя соотношение, мы даем более высокий процент одному из изображений, чтобы генерировать больше похожих изображений на себя, чем на другое.

III. Метод навигации 3: смешивание

Для третьего подхода мы находим средние векторы двух точек, между которыми мы интерполируем, и интерполируем между этими новыми векторами. На этом шаге выполняется интерполяция 50:50 между изображениями. На рисунке ниже мы показываем результаты смешивания с разными процентами каждого изображения плана.

IV. Метод навигации 4: Сочетание смешивания и неравных соотношений

Наконец, в последнем подходе мы комбинируем последние два метода: смешивание и интерполяции неравных отношений.

Изображения выше демонстрируют эффективность четырех представленных подходов. Порядок интерполяции во всех этих методах следующий: от точки A до точки B, затем C, затем D с 50 шагами между каждой интерполяцией.

V. Изменение порядка

Однако интерполяция в таком порядке — лишь один из возможных способов сделать это. Мы визуализируем на рисунке ниже результаты интерполяции в разных порядках между точками и показываем, как это простое изменение сильно влияет на сгенерированный результат.

VI. Изменение точек

Кроме того, все эти трехмерные структуры являются результатом интерполяции между четырьмя выбранными точками. Тем не менее, в таком широком скрытом пространстве у нас есть бесконечные возможности для интерполяции между ними. На рисунке ниже показана галерея выходных данных, сгенерированных с различными наборами из 4 начальных точек.

Обсуждение

Использование GAN и их внутренних свойств в этой статье представляет нам новый набор методов взаимодействия, которые обычно лежат за пределами традиционных границ архитектурной дисциплины. Включая эти дискретные шаги в наши процессы, мы демонстрируем альтернативное экспериментальное пространство, в котором форма косвенно генерируется посредством серии различных последовательных 2D-изображений. Мы утверждаем, что использование пикселя и вокселя в качестве строительных блоков архитектуры может освободить архитектурные чертежи от инструментов точности, а также восстановить потенциал чертежа для генеративного, латерального мышления. Хотя созданная из архитектурных планов, получающаяся в результате очень сложная галерея форм находится на пересечении концептуальных моделей и архитектурных структур, изображает отличительные эстетические особенности и выходит за рамки архитектурных результатов, с которыми мы знакомы сегодня.

Хотя формы получены из 2D-планов, эта методология не предназначена для использования в качестве единственной движущей силы архитектурного проекта. Кроме того, после создания трехмерных структур требуется опыт архитектора, чтобы преобразовать эти формы в осмысленные архитектурные предложения. Следовательно, для преобразования в функциональный инструмент необходимы дальнейшие исследования для более точного понимания различий и изменений в результатах, полученных с помощью применяемых методов.

Однако введенный конвейер, если он интегрирован в наши цифровые процессы, позволяет генерировать несколько различных результатов, которые не обязательно могут быть непосредственно связаны друг с другом, качества, которые хорошо согласуются с подходами латерального мышления. Такой подход с его многочисленными выходными вариантами и экспериментальным характером может позволить разработчику взглянуть на проблему в новом свете или вдохновить на нестандартные и новые способы мышления. Таким образом, это новое исследование может не только создать новые механизмы латентного мышления в процессах проектирования, но и позволить дизайнерам отойти от устоявшихся способов мышления и подвергнуть сомнению современные методы проектирования, встроенные в инструменты, которые мы обычно используем. предоставленный.

Заключение

В этой статье представлен план будущих исследований в области разработки инструментов, которые поощряют и подчеркивают подходы к экспериментам и латеральному мышлению в вычислительных инструментах архитектуры, качествам, которым сегодня не придается такого значения в наших инструментах. В частности, в этой статье мы представляем 4-этапный конвейер, управляемый ИИ, который использует скрытое пространство машины в качестве цифровой среды для проектирования, и демонстрируем примеры навигации в этом пространстве для создания трехмерных воксельных структур. Результаты этого процесса призваны выступать в качестве примеров возможных сценариев архитектурного процесса и в качестве переходов между текущими способами к спекулятивным способам проектирования.

Мы предполагаем, что такой конвейер, если он будет полностью интегрирован в цифровые архитектурные инструменты, может позволить нам включить латеральное мышление в наши текущие цифровые процессы и вывести наши архитектурные инструменты из мышления индустриальной эпохи. Следовательно, усиливая неопределенность и непредсказуемость, курс дисциплины может быть скорректирован с учетом нашего цифрового будущего.

В статье также рассказывается об использовании компьютеров не только как инструментов, но и как помощников в процессе проектирования и следующего шага к взаимодействию человека с компьютером. В отличие от цифровых инструментов, которые мы имеем сегодня, представленный конвейер вместо прямого отношения ввода-вывода позволяет машине свободно работать с пикселями и вносить свое собственное понимание ввода для создания рисунков. Именно в этом конкретном пространстве неточностей и неточностей, основанных на машинном восприятии и усвоенных функциях, заключается потенциал для воображения и нестандартного мышления. Это дает нам возможность работать с архитектурными чертежами новыми и новыми способами и может позволить открыть новые пространственные и ранее «немыслимые» концепции. Это также приводит к отходу от дизайнерских решений, принимаемых только человеческой логикой и предубеждениями, и позволяет нам переосмыслить способы проектирования и то, как мы формулируем нашу искусственную среду новыми и захватывающими способами.

Рекомендации

Остин М. и Мэтьюз Л. (2018 г., январь). Неточность рисования: цифровой рисунок в виде битов и пикселей. В материалах «Перекалибровка неточности и неверности» на 38-й ежегодной конференции Ассоциации автоматизированного проектирования в архитектуре, ACADIA 2018.

Боно, Э.Д. (1985). Шесть мыслящих шляп. Литтл, Браун и компания.

Шайю, С. (2019, 17 июля). ArchiGAN: генеративный стек для проектирования многоквартирных домов. Получено с https://devblogs.nvidia.com/archigan-generative-stack-apartment-building-design/

Клейпул, М. (2019). Конференция 2019. Конференция 2019. Получено с https://www.youtube.com/watch?v=PxAQL7y9wCw

Клейпул, М. (9 января 2020 г.). Цифровые технологии в архитектуре: тогда, сейчас и в будущем. Получено с https://space10.com/project/digital-in-architecture/

Кросс, Н. (2006). Дизайнерские способы познания. Спрингер Лондон. дои: 10.1007/1–84628–301–9.

Дорст, К. и Кросс, Н. (2001). Творчество в процессе проектирования: коэволюция проблемы-решения. Дизайнерские исследования, 22(5), 425–437.

Хуанг, В., и Чжэн, Х. (2018 г., октябрь). Распознавание и генерация архитектурных чертежей с помощью машинного обучения. В материалах 38-й ежегодной конференции Ассоциации автоматизированного проектирования в архитектуре (ACADIA), Мехико, Мексика (стр. 18–20).

Каррас, Т., Лейн, С., и Айла, Т. (2019). Архитектура генератора на основе стилей для генеративно-состязательных сетей. В материалах конференции IEEE по компьютерному зрению и распознаванию образов (стр. 4401–4410).

Клеммт, К., Пантич, И., Георге А., Себастьен, А., (2019). Дискретный и дискретный рост: дискретное создание геометрий, сгенерированных с помощью моделирования клеточного роста. В материалах ACADIA, 2019.

Лоусон, Б. (2006). Как думают дизайнеры: процесс проектирования демистифицирован. Рутледж.

Лю, Х., Ляо, Л., Шривастава, А. (2019). Анонимная композиция. В материалах ACADIA, 2019.

Мэй, Дж. (2018). Сигнал. Изображение. Архитектура. Издательство Колумбийского университета.

Миллер, А.И. (2019). Художник в машине: мир творчества на базе искусственного интеллекта. Массачусетский технологический институт Пресс.

Науата, Н., Чанг, К. Х., Ченг, К. Ю., Мори, Г., и Фурукава, Ю. (2020). House-GAN: реляционные генеративные состязательные сети для создания макета дома с ограничениями на граф. Препринт arXiv arXiv: 2003.06988.

Ньютон, Д. (2019). Генеративное глубокое обучение в архитектурном дизайне. Технология| Архитектура + Дизайн, 3 (2), 176–189.

Изола, П., Чжу, Дж. Ю., Чжоу, Т., и Эфрос, А. А. (2017). Преобразование изображения в изображение с условными состязательными сетями. В материалах конференции IEEE по компьютерному зрению и распознаванию образов (стр. 1125–1134).

Рецин, Г. (2019). Дискретный: переоценка цифровых технологий в архитектуре. Джон Уайли и сыновья.

Стинсон, MW (2017). Архитектурный интеллект: как дизайнеры и архитекторы создали цифровой ландшафт. Массачусетский технологический институт Пресс.