Как приручить нейросеть и зачем это архитектору
С чего начать и к чему стремиться в приручении нейросетей разбираемся вместе с архитекторами и основателями бюро Osetskaya.Salov, Александром Саловым и Татьяной Осецкой, и Алиной Черейской, архитектором и партнёром SA lab.
Словом 2023 года по версии Института русского языка имени Пушкина стало слово «нейросеть». С заключением экспертов сложно не согласиться — по данным проекта Яндекса «Нейростат», 31% россиян в возрасте 18–45 лет используют нейросети для генерации текстов и изображений и количество пользователей неуклонно растёт. Кажется, они по всюду и совершенно точно всё плотнее входят в нашу личную и профессиональную жизнь.
В работе архитектора нейросети — эффективный и доступный инструмент, способный ускорить работу с большими объёмами данных без потери качества и существенно облегчить некоторые рабочие процессы. Современные сервисы позволяют сократить время проектирования, полезны в создании гибких планировок, расчётах освещённости и аналитике городских данных. Кроме того, нейросети не менее полезны и в творческих задачах — работе с формой и геометрией, поиске идей и дополнительных смыслов проекта. И, конечно, ИИ можно поручить создание визуализаций проекта или 3D-моделей зданий на основе фотографий или чертежей. Но как и в любом софте, в этом инструменте нужно разобраться.
Найти общий язык
Кажется, многие считают, что у архитектора есть волшебная кнопка «выпустить проект». Также и те, кто совсем не был причастен к использованию нейросетей, думают, что можно просто забить техническое задание, и ИИ выдаст результат, с которым можно пойти к заказчику. В отдельных случаях это действительно возможно, но пока нейросети не позволяют исключить из процесса архитектора полностью.
Чтобы искусственный интеллект выдавал результаты, которые от него ожидают, нужно изучить варианты инструментов, понять их особенности, овладеть разными языками программирования и каждый день совершенствовать общение с ИИ. Главная задача архитектора, человека — правильно сформулировать запрос.
Человечество занимается развитием машинного обучения с середины XX века и вместе мы уже прошли через многое. SA lab выделяет три подхода в работе с нейросетями с точки зрения архитектурного проектирования: когда сервис становится инструментом, «вторым пилотом» или соавтором.
Самый простой путь взаимодействия — инструментальный подход, когда с помощью ИИ оптимизируются рутинные задачи, сокращающие, например, время поиска и отрисовки графических элементов. Скажем, Midjourney, используется для того, чтобы генерировать различные текстуры, объекты или фигуры, необходимые для рендеров. Этот этап прекрасно подходит для знакомства с принципом работы нейросетей и позволяет понять, на каком языке стоит выстраивать с ними коммуникацию.
Copilot или «второй пилот» — это непосредственно визуализация идей. В таком случае вместо длительного поиска референсов или других дополнительных изображений, автор может быстро генерировать изображения по текстовому описанию самостоятельно.
Использование нейросетей в соавторстве — это помощь в построении новой оптики и возможность посмотреть на проект под другим углом. Так или иначе любой автор находится в рамках собственного опыта и мысленных границ. Более глубокие технические знания, использование языки программирования, создание собственных моделей и самостоятельное обучение нейросетей позволяет получить неожиданные результаты.
Пойти от простого к сложному
Планируя свой воркшоп в рамках проекта «Открытый город», архитекторы и основатели бюро Osetskaya.Salov, Александр Салов и Татьяна Осецкая выбрали путь эксперимента. Тему и инструмент исследования задали непростые. «Квинтэссенция сакрального» — это мысленный эксперимент, задача которого изучить объёмную тему сакральных пространств как феномена, существующего вне религиозной функции, лишённого отсылок к культурным кодам и общечеловеческим паттернам. Чтобы сохранить чистоту исследования и освободить понятие «сакральности» от устоявшихся ассоциаций, прикладную работу построили на использовании нейросетей. Этот инструмент позволил обратиться к человеческому опыту, сохранив абстрактность и недосказанность образов, позволил участникам концентрироваться не на конкретных формах, размерах и материалах, а на эмоциях, чувствах и смыслах.
На старте участники воркшопа — студенты старших курсов архитектурных вузов — не были знакомы с работой нейросетей. Тем не менее, по итогам трёхмесячного воркшопа, большую часть которого занял теоретический блок, участники представили свои проекты: всё, что они демонстрировали, было сгенерировано при помощи разных нейросетей.
Работе с нейросетями предшествовал внушительный лекционный блок, затрагивающий социологию, психологию, культурологию, архитектуру. Теория дала основу всем запросам и самому замыслу автора — это по-прежнему зона ответственности человека.
Если говорить о порядке действий или пайплайне («pipeline» — последовательность действий или процессов, которые выполняются для достижения заданной цели), сначала участники генерировали вариации и находили идеи, затем создали в привычных программах грубую примитивную 3D-модель и загрузили её в нейросеть. В ответ нейросеть создавала иллюстрации и 2-4 секундные видео-ролики на основании этой геометрии. То есть это зацикленный процесс — диалог человека и искусственного интеллекта, требующий вовлечённости с обеих сторон.
Самым сложным оказался этап формулирования запроса — промпта (набор характеристик, которые позволяют нейросети выдать ожидаемый результат). Задачу усложняла тема исследования и суть самого проектируемого объекта: такой сложный философский и непонятный объект, как сакральное пространство, непросто описать даже человеку, не говоря о том, чтобы объяснить это нейросети. Но в результате каждой команде удалось наладить язык общения не только между собой, но и с теми нейросетями, которые они выбрали в качестве компаньонов.
Например, так шла работа в команде, разрабатывающей сакральное пространство в метавселенной.
Шаг 1. Поиск идеи и формы через генерации в Dream by Wombo и Midjourney:
Шаг 2. Разработка схемы работы павильона:
Шаг 3. Генерация видео в Stable Diffusion при помощи многоступенчатых промптов:
Наполнить цифровую форму смыслами
Над разработкой конкурсного проекта одноэтажного паркового павильона, бюро Osetskaya.Salov и SA lab работали в коллаборации. SA lab отвечали за взаимодействие с искусственным интеллектом и алгоритмическое проектирование, Osetskaya.Salov разработали визуальную и функциональную часть проекта.
На одном из первых этапов к проекту подключили нейросеть Dream.ai: перевели описание объекта с языка технического задания на язык, понятный нейронной сети и сгенерировали несколько вариантов визуализаций такого павильона. Это помогло определить принципы проекта: это должен быть деревянный конструктив с большим количеством воздуха и света — конструкция на «колоннах», наполненная разными функциями, которая с точки зрения идеи даст отсылки к разным образам, будет не прямолинейной, а даст человеку пространство для размышления и интерпретаций.
Конструктивно павильон представляет собой деревянную оболочку, внутри объемных «колонн» спрятаны технические помещения, а пространства между заполнены общественными функциями. Стеклянный контур размывает границу между парком и павильоном. За счет особенностей пространства, где всего четыре опоры, а все остальное — свободный план, у павильона несколько сценариев использования. Его можно зонировать мебелью или дополнительными элементами и адаптировать под разные события.
Кроме прочего, проект павильона для авторов стал ментальным экспериментом по переводу с языка архитектуры в цифровой язык и обратно — в понятный человеку язык образов и смыслов. Стартовая философия концепции возникла из цифрового мира, позволившего сформулировать первичные смыслы, которые затем трансформировались в объемно-пространственный образ физического объекта. Получилась конверсия смыслов: то, что было сформулировано машиной, как сложная переработка опыта человека математическими алгоритмами, вернулась назад в образ, понятный и близкий человеку.
Создать свой цифровой город
В 2023 году проект PIXPORT LAGOS, созданный SA lab совместно с промышленным дизайнером Santiago Sánchez, получил первое место в международном конкурсе HACKCITY 100 MOVING PIXELS за использование искусственного интеллекта и адаптивное архитектурное решение.
Компания Pix Moving, организовавшая конкурс, разрабатывает беспилотные автомобили. Внутри каждого такого компактного беспилотника размещается своя функция — мини-кафе, подкаст-студия, небольшой салон красоты или офис. По заданию конкурса авторам концепции предлагалось представить экспериментальный город, в котором будут взаимодействовать беспилотные автомобили, природа, человек и технологии.
Как правило, архитектурное проектирование следует step-by-step стратегии: с чистого листа проект шаг за шагом усложняется, обрастает новыми подробностями и детализируется. Работа с нейросетями позволяет перевернуть процесс проектирования: он начинается с множества генераций, из которых, опираясь на приоритеты проекта, необходимо вычленить одну, с которой работа продолжится.
Авторы задумали создание модульного, пульсирующего города — он может сжиматься, расширяться, менять свою конфигурацию и расположение. На первом этапе архитекторы заручились поддержкой Notion AI и You.com, чтобы описать, каким может быть современный подвижный город, какими он должен обладать особенностями и характеристиками. Это помогло сформировать промпт для генерации изображений с помощью предобученных моделей, которые работают по принципу text-to-image — Midjourney и Dream.ai.
Это помогло выявить параметры, которые легли в основу проекта — формообразующий материал и способ передвижения беспилотников. Решением стали модульные надувные конструкции, которые позволят сделать город подвижным и адаптивным. В то же время беспилотники могут передвигаться в разных средах, в том числе и внутри зданий — их путь можно прокладывать по воде и воздуху, помещать их в капсулы, чтобы они смогли передвигаться на более дальние расстояния в городе. Затем, начали работать с движением, используя различные алгоритмические инструменты.
Кроме того, чтобы дать название проекту, сделать презентацию, разработать скрипт для видеоролика и собрать видео также использовали нейросети — Notion AI, ChatGPT, You.com.
PixPort Lagos #futurecity #sustainability #architecture #urbanplanning #transport #modular #lagos
Экспериментировать
«Машина по созданию идей», о которой грезили фантасты начала XX века, становится сегодня таким же инструментом, хоть и по-настоящему революционным, какими являются для нас графические редакторы или автоматизированные системы проектирования — в своё время они наделали не меньше шума, отрывая архитектора от кульмана.
Несмотря на высокий уровень способностей и скорость развития искусственного интеллекта, в основе любого взаимодействия с ним лежит замысел, а значит — человек. Именно человек ведёт процесс создания нового вслед за идеей, отсекает лишнее и направляет, руководствуясь своей практикой, теоретическими знаниями и философией, закладываемой в проект. Самое важное в понимании отношений человека и инскусственного интеллекта — это навыки перевода языка человеческого мышления на язык на котором говорят нейроны метовселенной. Стоит особенно постараться, чтобы объяснить нейросети понятие красоты и масштаба художественного образа.
Найти общий язык поможет практика и эксперименты над собственными проектами.
Ниже дадим подсказку, к каким нейросетям можно обратиться с разными запросами.
Генерация изображений:
Midjourney
Dream by Wombo Runway
Kandinsky
Stable Diffusion
Chat GPT (DALL E)
Генерации видео:
Runway Kandinsky
Stable diffusion
Работа с текстом:
Chat GPT
Notion AI
You.com
Генерации аудио:
Mubert MusicGen
SoundDraw