Штучний інтелект починає жити поза браузером. У студійному курсі MIT 4.043/4.044 Interaction Intelligence студенти спроєктували фізичний інтерфейс на базі великих мовних моделей, який не просто підказує, а взаємодіє з вашим простором. Пристрій отримав назву Kitchen Cosmo і перетворює випадковий набір продуктів на надрукований план приготування. Ідея — показати, як Large Language Objects (LLOs) можуть працювати в реальному світі, а не лише в чаті.
Що таке LLO і навіщо вони потрібні
LLO — це новий клас інтерфейсів, які фізично розташовані у середовищі та працюють у реальному часі, доповнюючи можливості великої мовної моделі сенсорами, приводами та тактильними елементами. Саме на таку взаємодію робить ставку курс Interaction Intelligence в MIT під керівництвом Марсело Коельйо. Ідея проста: мова — не вся реальність; щоб бути корисним, ІІ має відчувати контекст, простір і людину поруч.
"They lack real-time, contextual understanding of our physical surroundings… In contrast, LLOs are physically situated and interact in real time with their physical environment." — Marcelo Coelho, MIT
Kitchen Cosmo: з холодильника – на папір
У центрі проєкту — тонкий прямокутний пристрій висотою близько 18 дюймів із відкидною вебкамерою, що сканує інгредієнти на столі. Модель інтерпретує побачене, спираючись також на базові спеції та соуси, які зазвичай є вдома, і пропонує рецепт. Далі вмикається термопринтер друкує рецепт — стрічку можна відірвати та зберегти у пластиковому тримачі на основі корпусу.
Рецепт під настрій і розклад
Команда заклала керування, яке робить ІІ "співкухарем", а не чорним ящиком. Передбачено налаштування:
- тип прийому їжі: сніданок, обід, вечеря чи перекус;
- рівень кулінарних навичок користувача;
- доступний час підготовки;
- кількість порцій;
- дієтичні вподобання;
- "настрій" або вайб страви — від ностальгійного до святкового, що задається окремою "крутилкою".
Тактильний інтерфейс структурує діалог із ІІ та дає користувачеві відчутний контроль над результатом.
Смак, культура і точність: де LLM помиляється
Щоб рецепти були здійсненними, розробникам довелося домогтися коректного врахування нагріву, часу і температури та навчити модель розпізнавати смакові профілі та спеції різних кухонь світу. Ранні версії не завжди були вдалими — студенти прямо тестували й дегустували, поки не досягли стабільності.
"An LLM needs to fundamentally understand human taste to make a great meal." — Ayah Mahmoud, MIT
Ретро-образ і відсилання до 1969 року
Після електроніки команда пройшла кілька ітерацій формоутворення на картоні, спроєктувала корпус у 3D і надрукувала його, офарбувавши у червоний — референс до Honeywell Kitchen Computer 1969, що рекламувався Neiman Marcus за десять тисяч доларів США і, за доступними записами, так і не знайшов покупців. "Ретро"-стиль тут поєднується з новою логікою взаємодії: замість невидимого бота — партнер на кухні із ручками та паперовими підказками.
"It was an ambitious but impractical early attempt at a home kitchen computer." — Jacob Payne, MIT
Куди далі рухається проєкт
Автори вже думають про наступні кроки. Джейкоб Пейн хоче, щоб пристрій використовував дані під час готування і давав поради в реальному часі. Ая Махмуд працює над оптимізацією для дипломного проєкту: серед ідей — режим для кількох людей із розподілом завдань та "навчальний режим" для інструментів, коли, наприклад, перед пристроєм кладуть офісний ніж для чищення, а система пояснює, як ним користуватися. Паралельно вона досліджує історію харчових наук, аби краще навчати модель "розуміти їжу" і точніше кастомізувати рецепти.
Контекст: фізичні ІІ-пристрої на підйомі
Світ бачить хвилю гаджетів, що поєднують штучний інтелект із сенсорами — від носимих асистентів до мініпристроїв для повсякденних задач. На цьому тлі Kitchen Cosmo вирізняється саме як LLO для кухні із тактильним керуванням і паперовим фідбеком. Потенційні вигоди очевидні: персоналізація під умови дому, підтримка новачків і досвідчених кухарів, а також зменшення харчових відходів завдяки новим ідеям для "залишків" у холодильнику. Водночас користувачам важливо зберігати пильність: перевіряти температури приготування й безпечність продуктів, адже моделі інколи помиляються.
Що це означає для вас
- Якщо ви втомилися від питань "що приготувати" — такі пристрої можуть запропонувати варіанти з того, що вже є на кухні.
- Любите керувати процесом — налаштування за настроєм, часом і складністю роблять ІІ гнучким.
- Поки це навчальний прототип від MIT, а не товар у магазині — стежте за оновленнями та появою подібних LLO на ринку.
На смак майбутнього
Kitchen Cosmo показує: коли великі мовні моделі виходять у фізичний простір, вони перестають бути лише текстом на екрані й стають інструментом, який враховує контекст вашого дому. Якщо наступні версії навчаться точніше працювати зі смаком, культурними кодами і технікою безпеки, наші кухні справді стануть розумнішими. Це той випадок, коли експеримент із аудиторії MIT може перерости у звичку щодня — принаймні, у вашій тарілці.