HY-Embodied-0.5: компактна модель для роботів на основі Mixture-of-Transformers
Tencent Robotics X і Hunyuan Vision випустили HY-Embodied-0.5 MoT-2B, молодшу модель для втіленого інтелекту. Модель виконує роль когнітивного ядра для VLA-пайплайнів, обробляючи кадри з камер робота та плануючи дії.
🔬 Перспективне дослідження. Модель може стати основою для недорогих роботів, якщо Tencent відкриє ваги.
🟢 МОЖЛИВОСТІ
- Локальний запуск на GPU від 16GB VRAM
- Можливість інтеграції з vLLM та Gradio
- Використання як когнітивного ядра для VLA-пайплайнів
🔴 ЗАГРОЗИ
- Потребує GPU з мінімум 16 ГБ VRAM
- Ліцензія Tencent HY Community License
- Поки що поступається RoboBrain і MiMo-Embodied у задачах планування
🎯 Чи підходить це вашому бізнесу?
Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.
Заповнити профіль · 30 секундTL;DR
- •HY-Embodied-0.5 MoT-2B містить 4 млрд параметрів, але на інференсі активно лише 2,2 млрд.
- •Рекомендовано GPU з мінімум 16 ГБ VRAM.
- •Ліцензується за Tencent HY Community License.
- •Архітектура базується на Mixture-of-Transformers.
- •Планується інтеграція з vLLM та Gradio-демо.
Як це змінить ваш ринок?
Виробники роботів зможуть створювати більш інтелектуальних та автономних роботів без значних витрат на обчислювальні ресурси. Це знімає бар'єр для масового впровадження робототехніки в логістиці та виробництві.
VLA-пайплайн — це конвеєр обробки візуальної інформації, який використовується для навчання роботів.
Для кого це і за яких умов
Для компаній, які займаються розробкою роботів та потребують компактну та ефективну модель для візуального сприйняття та планування. Потрібна GPU з 16 ГБ VRAM та базові знання машинного навчання. Розгортання займає від кількох годин до кількох днів.
Альтернативи
| HY-Embodied-0.5 MoT-2B | Qwen3-VL 2B/4B | RoboBrain 2.5 4B | MiMo-Embodied 7B | |
|---|---|---|---|---|
| Ціна | Безкоштовно | Дані не розкрито | Дані не розкрито | Дані не розкрито |
| Де працює | Локально, хмара | Локально, хмара | Локально, хмара | Локально, хмара |
| Мін. вимоги | GPU 16GB VRAM | Дані не розкрито | Дані не розкрито | Дані не розкрито |
| Ключова різниця | Компактність | Загальне призначення | Планування | Втілений інтелект |
💬 Часті запитання
Такий розбір щоранку о 08:00
Персональний AI-дайджест для вашої галузі — щодня у Telegram
Джерела
Machinelearning — оригіналНавчіть вашу команду будувати такі AI-автоматизації
За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.
Дізнатись більше → aiupskill.live