Комп'ютерне проєктування роками вимагало вузької експертизи та часу. Тепер команда MIT разом із колегами з Google DeepMind та Autodesk Research демонструє інший підхід: генеративний ІІ перетворює короткий опис у 3D‑модель, а роботизована збірка у реальному світі складає готовий об'єкт із модульних компонентів. Результат уже перевірили на меблях – стільцях та полицях – і дали користувачам оцінити. Понад 90 відсотків учасників обрали дизайни, створені новою системою, замість альтернативних підходів.
Що саме створили в MIT
Розробка складається з двох генеративних моделей. Одна з них генерує 3D‑представлення об'єкта за текстовою підказкою. Друга – vision-language model (VLM) – аналізує форму та функції майбутнього виробу й вирішує, як поєднати два типи готових деталей: структурні елементи та панелі. Далі робот автоматично збирає конструкцію з цих частин. Користувач може просити зміни, і система ітеративно вдосконалює дизайн без складних CAD‑навичок.
Як працює: від підказки до готового виробу
- Користувач вводить підказку, наприклад: "зроби мені стілець".
- Генеративна модель формує 3D‑сітку (mesh) майбутнього об'єкта.
- VLM "бачить" геометрію і визначає, де мають бути панелі – наприклад, на сидінні та спинці для зручності сидіння та опори.
- Поверхні позначаються й перевіряються, після чого панелі призначаються вибраним частинам.
- Робот збирає об'єкт із двох типів попередньо виготовлених модулів; конструкцію можна розбирати та збирати знову, зменшуючи відходи.
"Рано чи пізно ми захочемо спілкуватися з роботом і системою ІІ так само, як одне з одним, щоб створювати речі разом. Наша система – перший крок до такого майбутнього", – каже провідний автор Алекс Кйо (MIT).
Що вже зібрали і як оцінили
Команда виготовила меблі – від стільців до полиць – використовуючи лише два типи деталей. Випробування включали порівняння з іншими методами призначення панелей:
- алгоритм, що розміщує панелі на всіх горизонтальних поверхнях, обернених вгору;
- алгоритм, що розміщує панелі випадково.
У підсумку понад 90 відсотків учасників віддали перевагу варіантам, створеним ІІ‑системою MIT. Дослідники також просили VLM пояснювати свої рішення й з'ясували, що модель враховує функціональність – наприклад, потребу в поверхнях для сидіння та опори спини, – а не діє випадково.
Навіщо це потрібно бізнесу та споживачам
Демонстрація охоплює меблі, але рамка масштабована. Дослідники підкреслюють потенціал для швидкого прототипування складних об'єктів у аерокосмічній та архітектурній галузях. У довшій перспективі технологія може підтримати локальне виробництво – створення меблів чи інших виробів на місці, без перевезення громіздких товарів із центральних складів. Таке рішення з модульними, багаторазовими частинами сприяє зменшенню відходів під час виготовлення.
"Наша мета – різко знизити бар'єри доступу до інструментів дизайну. Ми показали, що можна поєднати генеративний ІІ та робототехніку, щоб швидко й доступно перетворювати ідеї на фізичні об'єкти", – зазначає Рендалл Девіс (MIT CSAIL).
Що далі у дорожній карті
Команда планує навчити систему працювати з більш складними запитами – наприклад, "стіл зі скла та металу" – і додати рухомі вузли на кшталт шестерень і петель, аби розширити функціональність зібраних виробів.
Хто за цим стоїть і де представили роботу
Автори: Алекс Кйо (MIT EECS та Архітектура), Річа Ґупта (MIT), Фаез Ахмед (асоційований професор механічної інженерії), Лоуренс Сасс (професор і керівник Computation Group у Школі архітектури), старший автор Рендалл Девіс (професор EECS, член CSAIL), а також дослідники з Google DeepMind та Autodesk Research. Розробку представлено на конференції Conference on Neural Information Processing Systems (NeurIPS).
Коротко: від ідей до речей
MIT показує, як генеративний ІІ разом із роботами знімає бар'єр входу в інженерний дизайн і робить створення речей простішим. Користувач формулює ідею – система проєктує, пояснює вибір і збирає готовий об'єкт. Якщо вам важливі час, гнучкість і сталість, така технологія може перетворити уявлення про домашнє та промислове виробництво вже у найближчі роки.