Искусственный интеллект позволяет превращать текст в реалистичные проекты зданий, но существующие модели часто неточно воспроизводят заданные параметры, например, могут ошибиться в количестве этажей из‑за недостатка подробных аннотаций в обучающих данных.
Исследователи из Японского института передовых наук и технологий совместно с коллегами из Тяньцзиньского университета разработали улучшенную систему генерации изображений. Она дополняет текстовые подсказки данными из внешних архитектурных наборов, благодаря чему модель опирается на реальные примеры.

Система имитирует рабочий процесс архитекторов: сначала преобразует текстовый запрос в простой эскиз с правильной этажностью, затем уточняет его, добавляя детали (окна, двери, элементы фасада) из базы данных реальных строительных компонентов и, наконец, объединяет уточненный эскиз с исходным описанием — получается реалистичное изображение, точно отражающее замысел.
Для тестирования создали три набора данных: 2 200 изображений строительных блоков, 4 000 изображений с вариантами расположения окон и входов, 1 600 пар «эскиз‑визуализация» для зданий кампуса.

Объективная оценка показала точность 70,5% в вертикальной конфигурации — это выше, чем у базовых моделей диффузии по показателям структурной точности, визуальной реалистичности и соответствия подсказкам. Субъективное исследование с участием 56 аспирантов в области архитектуры и дизайна подтвердило результаты: по пятибалльной шкале Ликерта система получила в среднем более 4 баллов за качество изображения, соответствие подсказкам и точность деталей.
Такой инструмент ускорит архитектурное проектирование: дизайнеры смогут быстро корректировать проекты на встречах с клиентами, а планировщики и застройщики — сравнивать десятки вариантов дизайна еще до детального моделирования. Развитие ИИ сделает архитектурную визуализацию доступнее и надежнее.
Ранее Наука Mail рассказывала о том, что ИИ-научная статья впервые прошла рецензирование.

