На китайських чипах натренували першу велику LLM
Meituan випустили LongCat 2.0 – 1,6 трильйона параметрів, навчений на 50 тисячах китайських чипів. Це важливо, бо відкриває можливість створювати масштабні LLM без Nvidia чи Google TPU.
🚀 LongCat 2.0 — конкурентна альтернатива дорогим API для компаній, які мають власні ML‑команди та готові інвестувати у GPU‑інфраструктуру.
🟢 МОЖЛИВОСТІ
- Внутрішнє розгортання без потреби у зовнішніх GPU‑хмарних провайдерах — зниження операційних витрат до 30 %.
- Apache 2.0/MIT ліцензія дозволяє кастомізувати модель під специфічні галузеві вимоги без додаткових ліцензійних платежів.
- Контекст до 1 млн токенів відкриває нові сценарії аналізу довгих документів та коду.
🔴 ЗАГРОЗИ
- Навчання та інференс 27B‑моделі вимагає GPU 24 GB+ (вартість $2 000+), що обмежує доступність для середніх компаній.
- Нестабільність кастомного Sparse Attention може призвести до непередбачуваних затримок у продуктивному середовищі.
- Відсутність відкритих ваг для повної моделі — лише часткові релізи, що ускладнює повний аудит безпеки.
🎯 Чи підходить це вашому бізнесу?
Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.
Заповнити профіль · 30 секундTL;DR
- •LongCat 2.0: 1,6 трильйона параметрів, 48 млрд активних.
- •Тренували на 35 трильйонах токенів, включаючи контекст до 1 млн токенів.
- •Ціна API $0.75 / $3 за мільйон токенів.
- •Ваги будуть випущені під Apache 2.0/MIT ліцензією.
- •Потреба у GPU 24 GB+ для великих варіантів моделі.
Як це змінить ваш ринок?
Для фінансових установ це означає можливість виконувати складний аналіз транзакцій і ризиків без передачі даних у хмари західних провайдерів, що знижує регуляторні бар’єри та витрати на compliance. Для медіа‑компаній довгі контекстні вікна дозволяють автоматизувати створення довгих статей і сценаріїв, скорочуючи час виробництва.
Визначення: Sparse Attention — механізм, який обирає підмножину токенів для обчислення уваги, зменшуючи вимоги до пам'яті.
Для кого це і за яких умов
- •7B модель: ноутбук MacBook 16 GB, без IT‑команди, розгортання за 15 хв.
- •27B модель: GPU 24 GB+ (вартість $2 000+) або хмара ~$0.5/год, IT‑спеціаліст, 1‑2 дні на налаштування.
- •Мінімальний масштаб: MID_50 (компанії з 50+ співробітниками або значними даними).
Альтернативи
| Продукт | Ціна (за 1M токенів) | Де працює | Мін. вимоги | Ключова різниця |
|---|---|---|---|---|
| OpenAI GPT‑4o | $5 | Хмара | Інтернет | Найвища якість, висока вартість |
| Anthropic Claude 2 | $3 | Хмара | Інтернет | Краща безпека, обмежений контекст |
| LongCat 2.0 | $0.75/$3 | Самостійно/Хмара | GPU 24 GB+ або CPU для 7B | Відкритий код, великий контекст |
Такий розбір щоранку о 08:00
Персональний AI-дайджест для вашої галузі — щодня у Telegram
Джерела
эйай ньюз — оригіналНавчіть вашу команду будувати такі AI-автоматизації
За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.
Дізнатись більше → aiupskill.live