НейтральнаImpact 6/10🔬 Research🏛️ Від 200 людей

Tencent випустила Hy3 — відкриту MoE модель на 295B параметрів

Shir-man Trendingблизько 12 годин тому0 переглядів

Tencent випустила Hy3, відкриту модель Active Mixture of Experts (MoE) з 295B параметрами. Модель доступна на Hugging Face, що потенційно знижує вхідний бар'єр для організацій, які хочуть використовувати великі мовні моделі.

ВердиктНейтральнаImpact 6/10

🔬 Перспективне дослідження. Модель велика, але відкрита ліцензія спростить експерименти для компаній з R&D відділами.

🟢 МОЖЛИВОСТІ

  • Локальне розгортання для безпечної обробки даних (GDPR, HIPAA)
  • Кастомізація під специфічні потреби бізнесу без залежності від API
  • Використання для досліджень та розробок в AI

🔴 ЗАГРОЗИ

  • Потрібні значні обчислювальні ресурси (GPU, хмара) для запуску 295B моделі
  • Необхідність в експертизі для налаштування та підтримки моделі
  • Ризик витоку даних при неправильній конфігурації локального розгортання

🎯 Чи підходить це вашому бізнесу?

Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.

Заповнити профіль · 30 секунд
Детальний розбір ↓

TL;DR

  • Модель Hy3 від Tencent має 295B параметрів.
  • Це Active Mixture of Experts (MoE) модель.
  • Відкритий код дозволяє кастомізацію.
  • Доступна на Hugging Face.
  • Потребує значних обчислювальних ресурсів.

Як це змінить ваш ринок?

Відкритий код Hy3 дозволить фінансовим установам та медичним організаціям обробляти чутливі дані локально, знімаючи блокери щодо конфіденційності та відповідності нормативним вимогам.

Active Mixture of Experts (MoE) — архітектура моделі, яка використовує кілька експертних підмоделей для обробки різних частин вхідних даних.

Для кого це і за яких умов

7B: потрібен MacBook Pro 16GB, без IT-команди, розгортання 15 хв. 295B: GPU $2,000+ або хмара ~$0.5/год, IT-спеціаліст, 1-2 дні на розгортання.

Альтернативи

Hy3 (Tencent)Llama 3 (Meta)GPT-4o (OpenAI)
ЦінаБезкоштовноБезкоштовно$15/1M токенів
Де працюєЛокальноЛокальноAPI
Мін. вимогиGPU $2000+GPU 24GBAPI
Ключова різницяВідкритий кодВідкритий кодЗакритий код

💬 Часті запитання

Для 7B моделі достатньо MacBook Pro з 16GB RAM. Для 295B моделі потрібна GPU вартістю $2000+ або хмарний сервіс з оплатою ~$0.5/год.

Такий розбір щоранку о 08:00

Персональний AI-дайджест для вашої галузі — щодня у Telegram

7 днів безкоштовно
TencentHy3open-sourceMoEHuggingFaceLLM

Навчіть вашу команду будувати такі AI-автоматизації

За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.

Дізнатись більше → aiupskill.live