Применение технологий искусственного интеллекта в автомобильном дизайне
Авторы: А. В. Шмелев, В. В. Бохонко, В. И. Ивченко, О. Н. Мойсей
Дизайн играет значительную роль в обеспечении конкурентоспособности автомобилей. Он не
только формирует эстетическое восприятие, но
и решает вопросы комфорта, безопасности, эффективности и экономичности, а также
помогает четко позиционировать автомобиль на целевом рынке [1–5].
В настоящее время процессы и средства разработки автомобилей в соответствии с
общемировыми трендами подвергаются масштабной цифровой трансформации, открывающей новые
перспективы для повышения их
эффективности за счет создания и применения принципиально новых решений и технологий.
Автомобильный дизайн также становится площадкой
для испытаний и внедрения передовых технологических инноваций.
Одним из перспективных направлений совершенствования процесса
дизайн-проектирования является применение технологий искусственного
интеллекта (ИИ). Использование ИИ в промышленном дизайне направлено
на расширение возможностей дизайнера, повышение качества результатов,
автоматизацию процессов, а также сокращение сроков и затрат на разработку. Ожидается,
что внедрение ИИ приведет к пересмотру роли человека, методов и инструментов
проектирования, существенно ускорив и повысив эффективность разработки [6–8]. В этой
связи актуальными являются задача изучения передового мирового опыта применения
технологий
ИИ в дизайне и разработка собственной методологической базы их интеграции в процесс
дизайн-проектирования.
В настоящее время ведутся активные исследования по расширению
возможностей прикладного использования технологий ИИ в дизайн-проектировании
автомобилей [9–15]. В частности, в традиционные процессы
разработки или доработки дизайна включаются различные подходы, обеспечивающие генерацию
реалистичных изображений автомобилей и их
компонентов, интеграцию с CAD- и CAE-системами, добавляются этапы
создания и тестирования дизайна по заданным эстетическим критериям
и техническим параметрам, по степени схожести с известными разработками и др. Также
возможности ИИ могут использоваться для распознавания образов, классификации
изображений, автоматического выделения
ключевых признаков и создания фильтров изображений, а также для создания цифровых
трехмерных моделей. Для их реализации применяются
соответствующие, преимущественно специализируемые, алгоритмы, обучаемые модели систем,
программ и другие средства.
Далее остановимся на существующих возможностях ИИ по генерации
и обработке изображений, текстур, стилей и дизайн-прототипов.
В данных целях могут быть использованы различные нейронные сети,
такие как: сверточные нейронные сети (CNN) – для анализа изображений,
генеративно-состязательные сети (GAN) – для создания новых дизайнерских концептов,
рекуррентные нейронные сети (RNN) – для генерации описаний и последовательностей, а
также глубокие нейронные сети (DNN) –
для оптимизации инженерных решений и производственных процессов.
Инструментами для генерации изображений на базе технологий ИИ
могут выступать веб-сайты и приложения, действующие с применением
нейросетей: DALL-E 2, Google's AutoML, Autodesk Generative Design, Fusion
Brain и др. В автомобильном дизайне наиболее активно используются
нейросети: MidJourney, Kandinsky, Stable Diffusion, Gravity Sketch и Vizcom.
Генерация изображений в них осуществляется следующими способами: по текстовому описанию
(Prompt), на основе задаваемого пользователем эскиза, путем сочетания указанных
способов.
Способ генерации изображений по текстовому описанию позволяет
создавать изображения на основе введенного пользователем описания, задаваемого по логике
«что я хочу получить?». Текстовое описание задается
максимально четким и детализированным, может включать разнообразные
характеристики, такие как класс автомобиля, тип кузова, текстуры, окружение,
особенности детализации и др. Недостатками такого способа являются: ограниченные
возможности по описанию сложных дизайнерских
идей, невоспроизводимость получаемых результатов и отсутствие точного
контроля процесса «донастройки» изображений. Генерация на основе задаваемого
пользователем изображения способна предоставить результат,
содержащий более детализированную информацию о форме, композиции
и других ключевых визуальных элементах.
Для демонстрации возможностей различных нейросетей далее будут
приведены результаты генерации изображений с использованием текстового описания,
характеризующего дизайн электрического кроссовера с футуристическим внешним видом,
аэродинамическими формами и окрашенными в красный цвет облицовочными деталями кузова, а
также с использованием разработанных авторских эскизов дизайна экстерьера легкового
электромобиля.
Нейросети Midjourney [16] и Stable Diffusion [17] позволяют создавать
генеративные изображения по текстовым описаниям. Веб-сайт Kandinsky
[18], разработанный компанией Sber AI, является российской нейросетью
для генерации изображений, аналогичной Midjourney. Он поддерживает
русский язык, генерирует изображения по текстовому описанию и (или) на
основе задаваемых изображений. На рис. 1 представлены примеры полученных дизайнерами
РКЦМП результатов генерации изображений электрического кроссовера с использованием
указанных нейросетей по заданному текстовому описанию.
Рис. 1. Результаты генерации изображений нейросетями:
а - Midjourney, б - Stable Diffusion, в - Kandinsky
Рис. 2. Результаты генерации изображений нейросетью Artbreeder
Mixer:
а, б - заданные пользователем; в, г - сгенерированные
Нейросети, работающие по способу генерации изображений по задаваемым пользователем
изображениям, могут использовать исходные изображения разной степени детализации, в том
числе эскизы. Например, в нейросети Artbreeder Mixer генерация изображений
осуществляется посредством смешения стилей, заданных пользователем. Пример результата
генерации изображения нейросетью Artbreeder Mixer путем комбинирования стилистики двух
легковых автомобилей представлен на рис. 2.
Примеры результатов работы нейросети PromeAI по генерации изображения легкового
электрического кроссовера на основе загруженного
ручного эскиза представлены на рис. 3
Рис. 3. Результаты генерации изображений нейросетью PromeAI:
а - заданный пользователем эскиз; б - сгенерированное изображение
Нейросеть Vizcom (Visual Communication) [19] имеет встроенный модуль с инструментами рисования для разработки пользовательских эскизов, которые наравне с загружаемыми изображениями (оцифрованными ручными эскизами, фотографиями, ранее разработанными генеративными изображениями и т. п.) могут использоваться для последующей обработки нейросетевыми алгоритмами по заданным текстовым описаниям или настройкам. Результат генерирования изображения легкового электромобиля по разработанному в векторном стиле эскизу с использованием нейросети Vizcom представлен на рис. 4.
Рис. 4. Результаты генерации изображения нейросетью Vizcom:
а - заданный пользователем эскиз; б - сгенерированное изображение
Благодаря широкому диапазону настроек нейросеть Vizcom предоставляет возможность создавать уникальные генеративные изображения для одинаковых исходных параметров. Например, в программе можно регулировать степень соответствия генерируемого изображения заданным исходным данным (рис. 5). Также программа позволяет генерировать изображения в различных стилях (рис. 6), например: Vizcom General – для создания фотореалистичных изображений, Automotive Exterior – для генерирования изображений автомобильных экстерьеров в эскизном стиле, Volume Render – для трехмерного отображения глубины и формы объекта и др. В настоящее время дополнительно появилась возможность создания собственных настроек стиля, что может быть использовано в разработках, ориентированных на учет влияния корпоративного стиля, нишевых ограничений или особенностей локальных рынков.
Рис. 5. Результаты генерации изображений нейросетью Vizcom с разным соответствием исходным данным
Рис. 6. Результаты генерации изображений нейросетью Vizcom с разными настройками стиля
Возможности нейросетей Artbreeder Mixer и Vizcom могут быть эффективно использованы для
поиска стилистических решений в ходе совершенствования дизайна существующих конструкций
автомобилей (рестайлинге) при наличии концептуальных эскизных решений по доработке
их внешнего вида.
Полученный опыт создания высокореалистичных генеративных изображений показал, что
применение ИИ для данных целей ускоряет процесс
поиска дизайнерских идей, улучшает качество получаемых изображений и
расширяет возможности для вариативного представления первоначальной
дизайн-концепции
Технологии ИИ являются одними из самых передовых и активно
внедряемых инновационных технологий для применения в дизайн-проектировании автомобилей.
Наряду с использованием других современных
программных и технических средств, таких как планшеты, очки виртуальной и дополненной
реальности, 3D-принтеры, графические редакторы
и многие другие, они способствуют расширению функциональности наблюдаемой в последнее
время масштабной цифровизации процесса дизайнпроектирования.
Применение технологий ИИ в промышленном дизайне в первую очередь направлено на
расширение возможностей дизайнера, повышение качества результатов работ, повышение
уровня автоматизации процесса дизайн-проектирования, снижение сроков и затрат на
разработку.
Актуальность внедрения технологий ИИ в процесс дизайн-проектирования подтверждается
наличием большого количества теоретических
и прикладных исследований в данной области, в том числе относящихся
непосредственно к созданию дизайна автомобиля, а также результатами
представленного исследования.
Выполненная апробация процесса создания высокореалистичных рендерных изображений
легковых электромобилей продемонстрировала пригодность нейронных сетей Midjourney,
Stable Diffusion, Kandinsky,
Artbreeder Mixer, PromeAI и Vizcom к прикладному использованию, а также подтвердила,
что их применение обеспечивает ускорение процесса поиска дизайн-идей, повышение
качества получаемых изображений и существенно расширяет возможности вариативного
представления разрабатываемой дизайн-концепции.
Литература:
1. Использование искусственного интеллекта для обработки персональных данных / В. В.
Денисенко, К. С. Евтеева, И. И. Савченко, А. А. Скрыпников // Международный журнал
гуманитарных и естественных наук. – 2020. – № 7-1. – С. 110–114.
2. Андреев, А. В. Искусственный интеллект и его роль в обработке больших данных / А. В.
Андреев // Умная цифровая экономика. – 2023. – Т. 3, № 1. – C. 65–69.
3. Chuxiao, Hou Application of Artificial Intelligence Technology in Smart Car
Design / Hou Chuxiao // Highlights in Science, Engineering and Technology (MECAE
2022). – 2022. –№ 15. – C. 322–325.
4. Чжан, Ц. Современное состояние и развитие искусственного интеллекта и больших данных
/ Ц. Чжан // Инновации. Наука. Образование. 2022. – № 50. – C. 2436–2446.
5. Матюшок, В. М. Мировой рынок систем и технологий искусственного интеллекта:
становление и тенденции развития / В. М. Матюшок, В. А. Красавина, С. В. Матюшок //
Вестник Российского университета дружбы народов. Сер.: Экономика. –
2020. – Т. 28, № 3. – С. 505–521.
6. Мaharaj, L. Revolutionizing Automotive Design with Artificial Intelligence /
L. Мaharaj. – URL:
https://medium.com/@labmaharaj/
revolutionizing-automotive-designwith-artificial-intelligence-b1ceff124b5b
(date of access: 18.02.2024)
7. Applications of Artificial Intelligence in Transport: An Overview / R. Abduljabbar,
H. Dia, S. Liyanage, S. A. Bagloee // Sustainability. – 2019. – № 11(1). – P. 189.
8. Review of artificial intelligence applications in engineering design perspective /
N. Yüksel, H. R. Börklü, H. K. Sezer, O. E. Canyurt // Engineering Applications of
Artificial
Intelligence. – Vol. 118. – 2023. – P. 105697.
9. Burnap, A. Product Aesthetic Design: A Machine Learning Augmentation /
A. Burnap, J. R. Hauser, A. Timoshenko // Marketing Science. – 2023. – Vol. 42, iss. 6.
–
P. 1029–1056.
10. GEO: A computational design framework for automotive exterior facelift /
J. Huang, B. Chen, Z. Yan, [et al.] // ACM Transactions on Knowledge Discovery from
Data. – 2023. – Vol. 17(6), no. 82 – P. 1–20.
11. Visual Object Networks: Image Generation with Disentangled 3D Representation /
J.-Y. Zhu, Z. Zhang, C. Zhang [et al.] // NIPS'18: Proceedings of the 32nd International
Conference on Neural Information Processing Systems. – 2018. – P. 118–129.
12. Integrating deep learning into CAD/CAE system: generative design and evaluation
of 3D conceptual wheel / S. Yoo, S. Lee, S. Kim [et al.] // Structural and
Multidisciplinary
Optimization. – 2021. – Vol. 64, no. 4. – P. 2725–2747.
13. Integrating Deep Learning into CAD/CAE System:
Case Study on Road Wheel
Design Automation / S. Yoo, S. Lee, S. Kim [et al.]. – URL:
https://www.researchgate.net/
publication/341899356_Integrating_Deep_
Learning_into_CADCAE_
System_Case_Study_on
_Road_Wheel_Design_Automation (date of access: 01.03.2024).
14. Application of deep metric learning in the verification process of wheel design
similarity: Hyundai motor company case / K. P. Kang, G. H. Jung, J. H. Eom [et al.] //
AI Magazine. – Vol. 44. – 2023. – P. 406–417.
15. Drag-guided diffusion models for vehicle image generation / N. Arechiga,
F. Permenter, B. Song, Ch. Yuan. – URL: https://www.researchgate.net/publication/
371684712_Drag-guided_diffusion_models_for_vehicle_image
_generation (date of access:
01.03.2024).
16. Midjourney. – URL: https://www.midjourney.com/home (date of access:
14.03.2024).
17. Scribble Diffusion. – URL: https://vercel.com/templates/next.js/scribble-diffusion/
(date of access: 14.03.2024).
18. Кandinsky 3.1. –URL: https://www.sberbank.com/promo/kandinsky/ (date of
access: 14.03.2024).
19. Accelerating the Journey from Sketch to Production / Vizcom. – URL:
https://www.vizcom.ai/ (date of access:14.03.2024)