Lyra 2.0: фреймворк NVIDIA для генерації 3D-світів з однієї фотографії

Machinelearningблизько 2 годин тому0 переглядів

NVIDIA випустила Lyra 2.0, систему для генерації 3D-світів з однієї фотографії. Це дозволить масово створювати навчальні 3D-середовища для роботів та embodied AI, прискорюючи їх розробку.

ВердиктПозитивнаImpact 6/10

🔬 Перспективне дослідження. Спрощує створення 3D-середовищ для навчання AI, але поки що на стадії прототипу.

🟢 МОЖЛИВОСТІ

  • Зменшення витрат на створення 3D-середовищ для навчання AI на 50%+
  • Прискорення розробки роботів та віртуальних асистентів завдяки автоматизації генерації тренувальних даних
  • Можливість створення реалістичних симуляцій для тестування AI-моделей в різних умовах

🔴 ЗАГРОЗИ

  • Високі вимоги до обчислювальних ресурсів для навчання та генерації (GPU з великим об'ємом VRAM)
  • Ризик генерації нереалістичних або невідповідних сценаріїв, що може негативно вплинути на навчання AI
  • Необхідність додаткової обробки та валідації згенерованих 3D-світів для забезпечення їх якості

🎯 Чи підходить це вашому бізнесу?

Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.

Заповнити профіль · 30 секунд
Детальний розбір ↓

TL;DR

  • Lyra 2.0 приймає на вхід одне зображення.
  • Генерує відео з керованою траєкторією камери.
  • Реконструює відео в 3D-гауссіани та полігональні меші.
  • Ассети можна імпортувати в ігрові рушії та симулятори робототехніки.
  • Базова модель побудована на архітектурі Wan 2.1-14B.

Як це змінить ваш ринок?

Виробники роботів зможуть значно пришвидшити розробку, автоматично генеруючи 3D-середовища для навчання embodied AI. Це знімає блокер з ручного створення тренувальних даних.

Embodied AI — штучний інтелект, втілений у фізичному тілі (роботі), який взаємодіє з реальним світом.

Для кого це і за яких умов

Для розробників роботів, геймдев студій та дослідників AI. Потрібна команда з досвідом роботи з 3D-графікою та ML. Для навчання моделі потрібні потужні GPU.

Альтернативи

Lyra 2.0Genie 3 (Google)Інші генеративні моделі (наприклад, GAN)
ЦінаБезкоштовно (open-source)Ціна не оголошенаЗалежить від моделі (від безкоштовних до платних)
Де працюєЛокально або в хмаріХмарний сервісЛокально або в хмарі
Мін. вимогиПотужна GPUДоступ до хмарного сервісуЗалежить від моделі
Ключова різницяOpen-source, локальний запуск, висока якістьЗакритий код, хмарний сервіс, інтеграція з GoogleРізна якість та функціональність

💬 Часті запитання

Для навчання та генерації 3D-світів потрібна потужна GPU з великим об'ємом VRAM (24GB+).

Такий розбір щоранку о 08:00

Персональний AI-дайджест для вашої галузі — щодня у Telegram

7 днів безкоштовно
Lyra2.0NVIDIA3DgenerationembodiedAI3Dreconstruction

Навчіть вашу команду будувати такі AI-автоматизації

За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.

Дізнатись більше → aiupskill.live