Использование технологий искусственного интеллекта при разработке дизайна автотранспортных средств

Авторы: В.И. Ивченко, Д.В. Павлович, О.Н. Мойсей, В.В. Бохонко

Рассмотрены варианты прикладного использования технологий искусственного интеллекта в промышленном дизайне и, в частности, при разработке дизайна автомобилей, обеспечивающие ускорение процесса поиска дизайн-идей, повышение качества получаемых изображений, а также расширение вариативности представления исходной дизайн-концепции. Представлены возможности применения нейронных сетей для генерации и обработки изображений, текстур, стилей и дизайн-прототипов. Приведены примеры результатов создания высокореалистичных генеративных изображений экстерьера легковых электромобилей с использованием нейросетей MidJourney, Stable Diffusion, Kandinsky, Artbreeder Mixer, PromeAI и Vizcom по текстовым описаниям, на основе задаваемых эскизов, а также путем сочетания указанных способов. Подтверждена значимость и перспективность прикладного применения технологий ИИ при разработке дизайна автотранспортных средств.

Введение

Наблюдаемая в настоящее время цифровая трансформация процессов разработки и производства промышленной продукции открывает новые возможности по повышению их эффективности за счет создания и использования принципиально новых решений и технологий. Таким образом внедрение инноваций и передовых цифровых технологий становится обязательным условием поддержания конкурентоспособности, удовлетворения меняющихся и растущих ожиданий потребителей, повышения производительности и снижения издержек.

Эти тенденции в полной мере проявляются в автомобильной промышленности, которая отличается высокой наукоемкостью продукции и жесткой конкуренцией на рынке. Значительную роль в обеспечении конкурентоспособности автомобилей играет их дизайн. Он не только формирует эстетическое восприятие, но и решает вопросы комфорта, безопасности, эффективности и экономичности, а также помогает четко позиционировать автомобиль на целевом рынке [1-5].

Автомобильный дизайн становится площадкой для испытаний и внедрения передовых технологических инноваций. В процесс дизайн-проектирования уже интегрированы современные технологии создания и редактирования цифровых изображений, трёхмерного проектирования, виртуальной и дополненной реальности, 3D-печати, реверс-инжиниринга и др.

Одним из перспективных направлений совершенствования дизайн-проектирования является использование искусственного интеллекта (далее - ИИ). Применение технологий ИИ в промышленном дизайне в первую очередь направлено на расширение возможностей дизайнера, повышение качества результатов работ, уровня автоматизации процесса дизайн-проектирования, снижение сроков и затрат на разработку. Ожидается, что внедрение ИИ в этот процесс приведет к пересмотру роли человека, методов и инструментов проектирования, значительно ускорит и повысит эффективность разработки [6-8].

Применение ИИ при дизайн-проектировании автомобилей позволяет расширять диапазон решаемых задач совершенствования и оптимизации конструкции автомобиля на самых ранних стадиях разработки с целью выхода на запланированные характеристики автомобиля и повышения его потребительских свойств. Указанные цели дизайн-проектирования могут включать вопросы разработки и совершенствования стиля, эффективности, безопасности, комфорта и экономичности автомобиля.

Применение технологий искусственного интеллекта при разработке дизайна автотранспортных средств

В настоящее время ведутся активные исследования по расширению возможностей прикладного использования технологий ИИ в дизайн-проектировании автомобилей [9-15]. В частности, в традиционные процессы разработки или доработки дизайна включаются различные подходы, обеспечивающие генерацию реалистичных изображений автомобилей и их компонентов, интеграцию с CAD и CAE системами, добавляются этапы создания и тестирования дизайна по заданным эстетическим критериям и техническим параметрам, а также по степени схожести с известными разработками и др. Также возможности ИИ могут использоваться для распознавания образов, классификации изображений, автоматического выделения ключевых признаков и создания фильтров изображений, а также для создания цифровых трехмерных моделей.

Для их реализации используются соответствующие, преимущественно специализируемые, алгоритмы, обучаемые модели систем, программ и др. средства. Далее остановимся на существующих возможностях ИИ по генерации и обработке изображений, текстур, стилей и дизайн-прототипов.

В данных целях могут быть использованы различные нейронные сети, такие как: сверточные нейронные сети (CNN) – для анализа изображений, генеративно-состязательные сети (GAN) – для создания новых дизайнерских концептов, рекуррентные нейронные сети (RNN) – для генерации описаний и последовательностей, а также глубокие нейронные сети (DNN) – для оптимизации инженерных решений и производственных процессов.

Инструментами для генерации изображений на базе технологий ИИ могут выступать такие веб-сайты и приложения, действующие с применением нейросетей, как: DALL-E 2, Google's AutoML, Autodesk Generative Design, Fusion Brain и др. В автомобильном дизайне наиболее активно применяются нейросети: MidJourney, Kandinsky, Stable Diffusion, Gravity Sketch и Vizcom.

Генерация изображений в них осуществляется следующими способами: по текстовому описанию (Prompt), на основе задаваемого пользователем эскиза, а также путем сочетания указанных способов.

Способ генерации изображений по текстовому описанию позволяет создавать изображения на основе введенного пользователем описания, задаваемого по логике «Что я хочу получить?». Текстовое описание задается максимально четким и детализированным, может включать разнообразные характеристики, такие как класс автомобиля, тип кузова, текстуры, окружение, особенности детализации и др.

Для демонстрации возможностей различных нейросетей далее будут приведены результаты генерации изображений с использованием текстового описания, характеризующего дизайн электрического кроссовера с футуристическим внешним видом, аэродинамическими формами и окрашенными в красный цвет облицовочными деталями кузова.

Нейросеть MidJourney [16] способна генерировать изображения на основе текстовых описаний. Для каждого описания можно создать от одного до четырех различных изображений.

На рисунке 1 представлены примеры результатов генерации изображений электрического кроссовера указанной нейросетью.

Рис. 1. Результаты генерации изображений нейросетью MidJourney

Нейросеть Stable Diffusion [17] также генерирует изображения по текстовым описаниям. Примеры результатов генерации изображений электрического кроссовера по заданному текстовому описанию в Stable Diffusion представлены на рисунке 2.

Рис. 2. Результаты генерации изображений нейросетью Stable Diffusion

Веб-сайт Kandinsky [18], разработанный компанией Sber AI, является российской нейросетью для генерации изображений, аналогичной Midjourney. Он поддерживает русский язык, генерирует изображения по текстовому описанию и/или на основе задаваемых изображений. В отличие от Midjourney, Kandinsky предлагает неограниченное количество вариантов, что расширяет возможности поиска дизайнерских решений. Примеры результатов генерации изображений электрического кроссовера нейросетью Kandinsky по заданному текстовому описанию представлены на рисунке 3.

Рис. 3. Результаты генерации изображений нейросетью Kandinsky

В нейросети Artbreeder Mixer генерация изображений может выполняться только за счет смешения стилей, заданных пользователем двух и более изображений. Пример результата генерации нейросетью Artbreeder Mixer изображения путем комбинирования стилистики двух легковых автомобилей представлен на рисунке 4.

а, б – заданные пользователем изображения; в, г – сгенерированные изображения
Рис. 4. Генерация изображений нейросетью Artbreeder Mixer

Нейросети, работающие по способу генерации изображений по задаваемым пользователем изображениям, могут использовать исходные изображения разной степени детализации, в том числе эскизы. Нейросети анализируют полученный эскиз и генерируют более детализированное и проработанное изображение. Примеры результатов работы нейросети PromeAI по генерации изображения легкового электрического кроссовера на основе загруженного ручного эскиза представлены на рисунке 5. В данной нейросети имеется возможность генерировать три и более эскиза за один запрос.

а – заданный пользователем эскиз; б, в, г – сгенерированные изображения
Рисунок 5. Результаты генерации изображений нейросетью PromeAI

Генерация изображений с использованием технологий ИИ позволяет на этапе эскизного поиска увеличить количество вариантов идей для дальнейшей проработки дизайн-концепции.

Недостатками подхода генерации изображений с использованием текстового описания являются: ограниченные возможности по описанию сложных дизайнерских идей, невоспроизводимость получаемых результатов и отсутствие точного контроля процесса «донастройки» изображений.

Генерация на основе задаваемого пользователем изображения способна предоставить результат, содержащий более детализированную информацию о форме, композиции и других ключевых визуальных элементах. Возможность нейросети лучше оценить и, соответственно, более адекватно интерпретировать задаваемые пользователем основные формы и пропорции позволяет ей наиболее достоверно придерживаться исходного художественного стиля и значительно улучшает четкость финального изображения. Поскольку эскиз уже содержит основные элементы и форму, нейросеть концентрируется на добавлении деталей и улучшении качества.

Еще одним инструментом для визуализации рисунков и эскизов является Vizcom (Visual Communication) [19]. Он позволяет получать высококачественные реалистичные изображения на основе эскизов, непосредственно созданных в интерфейсе Vizcom с помощью встроенных инструментов рисования и на основе загруженных изображений (ручных эскизов, генеративных изображений, фотографий и т.п.), обработанных нейросетевыми алгоритмами по заданным текстовым описаниям.

В Vizcom рендер по эскизу экстерьера легкового автомобиля можно получить двумя способами: оцифровав и загрузив его в программу, или предварительно доработав эскиз в векторном стиле, создавая замкнутый контур изображения (рисунок 6). Первый способ является самым быстрым, но менее качественным из-за возможной хаотичности линий и погрешностей в пропорциях. Второй метод позволяет программе точнее интерпретировать форму и применять более качественные текстуры.

а – генеративное изображение на основе ручного эскиза, б – генеративное изображение на основе векторного эскиза
Рисунок 6. Результаты генерации изображений нейросетью Vizcom

На рисунке 7 показаны результаты генерирования изображений для различных вариантов представления объекта: в городской среде, на фоне леса и в пустынной местности, полученные по соответствующим текстовым описаниям.

Рисунок 7. Результаты генерации изображений нейросетью Vizcom на основе различного текстового описания цветов, текстур и фонов

Благодаря широкому диапазону настроек нейросеть Vizcom предоставляет возможность создавать уникальные генеративные изображения для одинаковых исходных параметров. Например, в программе можно регулировать степень соответствия генерируемого изображения заданным исходным данным. На рисунке 8 показаны примеры полученных результатов генерирования изображений на базе одного и того же эскиза с разной степенью соответствия исходным данным. Также программа позволяет генерировать изображения в различных стилях (рисунок 9): Vizcom General – для создания фотореалистичных изображений, Automotive Exterior – для генерирования изображений автомобильных экстерьеров в эскизном стиле, Volume Render – для трехмерного отображения глубины и формы объекта, Technicolor 6 – для футуристических изображений с акцентом на атмосферу и окружение, Pastel Render – для изображений в пастельных тонах, и Cyber Cel – для ярких однотонных изображений с четкими контурами и высокой контрастностью.

Рисунок 8. Результаты генерации изображений нейросетью Vizcom с разным соответствием исходным данным

Рисунок 9. Результаты генерации изображений нейросетью Vizcom с разными настройками стиля

По представленным изображениям можно сделать вывод, рассмотренные нейросети способны в автоматизированном режиме генерировать качественные высокореалистичные изображения экстерьера легковых электромобилей, пригодные для дальнейшего использования при поиске и разработке их стилистических решений.

Кроме того, возможности нейросетей Artbreeder Mixer и Vizcom могут быть максимально эффективно использованы для поиска стилистических решений в ходе совершенствования дизайна существующих конструкций автомобилей при наличии концептуальных эскизных решений по доработке их внешнего вида.

Полученный опыт создания высокореалистичных генеративных изображений показал, что применение ИИ при дизайн-проектировании легковых электромобилей позволяет ускорять процесс поиска дизайнерских идей, улучшать качество получаемых изображений и расширять возможности для вариативного представления первоначальной дизайн-концепции.

Заключение

Технологии ИИ являются одними из самых передовых и активно внедряемых инновационных технологий для применения в промышленном дизайн-проектировании. Наряду с использованием других современных программных и технических средств, таких как планшеты, очки виртуальной и дополненной реальности, 3D-принтеры, графические редакторы и многие другие, они способствуют наблюдаемой в последнее время масштабной цифровизации процесса дизайн-проектирования.

Применение технологий ИИ в промышленном дизайне в первую очередь направлено на расширение возможностей дизайнера, повышение качества результатов работ, повышение уровня автоматизации процесса дизайн-проектирования, снижение сроков и затрат на разработку.

Актуальность внедрения технологий ИИ в процесс дизайн-проектирования подтверждается наличием большого количества теоретических и прикладных исследований в данной области, в том числе относящихся непосредственно к созданию дизайна автомобиля.

Проведенное исследование демонстрирует потенциальные возможности по прикладному использованию технологий ИИ в дизайн-проектировании транспортных средств, а именно по генерированию высокореалистичных изображений экстерьера легковых автомобилей.

Приведенные примеры генерирования изображений подтверждают значимость и перспективность применения технологий ИИ в промышленном дизайне в целях расширения возможностей дизайнеров, повышения качества их работ, увеличения уровня автоматизации, а также сокращения сроков и затрат на разработку.

Литература:

1. Денисенко, В.В. Использование искусственного интеллекта для обработки персональных данных / В.В. Денисенко, К.С. Евтеева, И.И.Савченко, А.А. Скрыпников // Международный журнал гуманитарных и естественных наук. – 2020. – №7-1. – С. 110–114.
2. Андреев, А.В. Искусственный интеллект и его роль в обработке больших данных / А.В. Андреев // Умная цифровая экономика. – 2023. – Т.3, №1. – C. 65–69.
3. Chuxiao, Hou Application of Artificial Intelligence Technology in Smart Car Design / Hou Chuxiao Hou // Highlights in Science, Engineering and Technology (MECAE 2022). – 2022. –№15. – C. 322–325.
4. Чжан, Ц. Современное состояние и развитие искусственного интеллекта и больших данных / Ц. Чжан // Инновации. Наука. Образование. 2022. – № 50. – C. 2436–2446.
5. Матюшок, В.М. Мировой рынок систем и технологий искусственного интеллекта: становление и тенденции развития / В.М. Матюшок, В.А. Красавина, С.В. Матюшок // Вестник Российского университета дружбы народов. Сер.: Экономика. – 2020. – Т. 28. No 3. – С. 505–521.
6. Lab Мaharaj Revolutionizing Automotive Design with Artificial Intelligence [Electronic resource]: 2023. – Mode of access: https://medium.com/@labmaharaj/revolutionizing-automotive-design-with-artificial-intelligence-b1ceff124b5b. – Date of access: 18.02.2024.
7. Abduljabbar, R. Applications of Artificial Intelligence in Transport: An Overview / R. Abduljabbar, H. Dia, S. Liyanage, S.A. Bagloee // Sustainability. –2019. – №11(1). – P.189.
8. Yüksel, N. Review of artificial intelligence applications in engineering design perspective / N. Yüksel, H. R. Börklü, H. K. Sezer, O. E. Canyurt // Engineering Applications of Artificial Intelligence. – Vol. 118. – 2023. 105697.
9. Burnap, A. Product Aesthetic Design: A Machine Learning Augmentation / A. Burnap, J.R. Hauser, A.  Timoshenko // Marketing Science. – 2023. – Vol.42 (Iss.6.). – P.1029-1056.
10. Huang, J. GEO: A computational design framework for automotive exterior facelift / J. Huang, B. Chen, Z. Yan, I. Ounis, J. Wang. // ACM Transactions on Knowledge Discovery from Data. – 2023. – 17(6), No. 82 – P. 1–20.
11. Zhu, J.-Y. Visual Object Networks: Image Generation with Disentangled 3D Representation / J.-Y. Zhu, Z. Zhang, C. Zhang, J. Wu, A. Torralba, J.B. Tenenbaum, W.T. Freeman // NIPS'18: Proceedings of the 32nd International Conference on Neural Information Processing Systems. – 2018. – P. 118–129.
12. Yoo, S. Integrating deep learning into CAD/CAE system: generative design and evaluation of 3D conceptual wheel / S. Yoo, S. Lee, S. Kim, K.H. Hwang,  J.H. Park, N. Kang // Structural and Multidisciplinary Optimization. – 2021. Vol. 64, No. 4, – P. 2725–2747.
13. Yoo, S. Integrating Deep Learning into CAD/CAE System: Case Study on Road Wheel Design Automation / S. Yoo, S. Lee, S. Kim, K.H. Hwang, J.H. Park, N. Kang [Electronic resource]. – 2020 – Mode of access: https://www.researchgate.net/publication/ 341899356_Integrating_ Deep_Learning_into_CADCAE_System_Case_ Study_on_Road_Wheel_ Design_Automation. – Date of access: 01.03.2024.
14. Kang, K.P. Application of deep metric learning in the verification process of wheel design similarity: Hyundai motor company case / K.P. Kang, G.H. Jung, J.H. Eom, S.B. Kwon, J.H. Park. // AI Magazine 44, –2023. – P. 406–417.
15. Arechiga, N. Drag-guided diffusion models for vehicle image generation / N/ Arechiga, F. Permenter, B. Song, Ch. Yuan. [Electronic resource]. – 2023 – Mode of access: https://www.researchgate.net/publication/ 371684712_Drag-guided_diffusion_models_for_vehicle_image_ generation. – Date of access: 01.03.2024.
16. Midjourney. [Electronic resource]. Mode of access: https://www.midjourney.com/home. – Date of access:14.03.2024.
17. Scribble Diffusion [Electronic resource]. Mode of access: https://vercel.com/templates/next.js/scribble-diffusion/– Date of access:14.03.2024.
18. Кandinsky 3.1 [Electronic resource]. Mode of access: https://www.sberbank.com/promo/kandinsky/– Date of access:14.03.2024.
19. Accelerating the Journey from Sketch to Production / Vizcom [Electronic resource]. Mode of access: https://www.vizcom.ai/ Date of access:14.03.2024.