HY-Embodied-0.5: компактна модель для роботів на основі Mixture-of-Transformers

Machinelearningблизько 6 годин тому0 переглядів

Tencent Robotics X і Hunyuan Vision випустили HY-Embodied-0.5 MoT-2B, молодшу модель для втіленого інтелекту. Модель виконує роль когнітивного ядра для VLA-пайплайнів, обробляючи кадри з камер робота та плануючи дії.

ВердиктПозитивнаImpact 6/10

🔬 Перспективне дослідження. Модель може стати основою для недорогих роботів, якщо Tencent відкриє ваги.

🟢 МОЖЛИВОСТІ

  • Локальний запуск на GPU від 16GB VRAM
  • Можливість інтеграції з vLLM та Gradio
  • Використання як когнітивного ядра для VLA-пайплайнів

🔴 ЗАГРОЗИ

  • Потребує GPU з мінімум 16 ГБ VRAM
  • Ліцензія Tencent HY Community License
  • Поки що поступається RoboBrain і MiMo-Embodied у задачах планування

🎯 Чи підходить це вашому бізнесу?

Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.

Заповнити профіль · 30 секунд
Детальний розбір ↓

TL;DR

  • HY-Embodied-0.5 MoT-2B містить 4 млрд параметрів, але на інференсі активно лише 2,2 млрд.
  • Рекомендовано GPU з мінімум 16 ГБ VRAM.
  • Ліцензується за Tencent HY Community License.
  • Архітектура базується на Mixture-of-Transformers.
  • Планується інтеграція з vLLM та Gradio-демо.

Як це змінить ваш ринок?

Виробники роботів зможуть створювати більш інтелектуальних та автономних роботів без значних витрат на обчислювальні ресурси. Це знімає бар'єр для масового впровадження робототехніки в логістиці та виробництві.

VLA-пайплайн — це конвеєр обробки візуальної інформації, який використовується для навчання роботів.

Для кого це і за яких умов

Для компаній, які займаються розробкою роботів та потребують компактну та ефективну модель для візуального сприйняття та планування. Потрібна GPU з 16 ГБ VRAM та базові знання машинного навчання. Розгортання займає від кількох годин до кількох днів.

Альтернативи

HY-Embodied-0.5 MoT-2BQwen3-VL 2B/4BRoboBrain 2.5 4BMiMo-Embodied 7B
ЦінаБезкоштовноДані не розкритоДані не розкритоДані не розкрито
Де працюєЛокально, хмараЛокально, хмараЛокально, хмараЛокально, хмара
Мін. вимогиGPU 16GB VRAMДані не розкритоДані не розкритоДані не розкрито
Ключова різницяКомпактністьЗагальне призначенняПлануванняВтілений інтелект

💬 Часті запитання

HY-Embodied-0.5 MoT-2B є компактною моделлю, яка забезпечує високу якість візуального сприйняття та просторового мислення при відносно низьких обчислювальних витратах.

Такий розбір щоранку о 08:00

Персональний AI-дайджест для вашої галузі — щодня у Telegram

7 днів безкоштовно
AIMLEmbodiedIntelligenceRoboticsTencentHunyuanMixture-of-Transformers

Навчіть вашу команду будувати такі AI-автоматизації

За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.

Дізнатись більше → aiupskill.live