На китайських чипах натренували першу велику LLM

TL;DR

•LongCat 2.0: 1,6 трильйона параметрів, 48 млрд активних.
•Тренували на 35 трильйонах токенів, включаючи контекст до 1 млн токенів.
•Ціна API $0.75 / $3 за мільйон токенів.
•Ваги будуть випущені під Apache 2.0/MIT ліцензією.
•Потреба у GPU 24 GB+ для великих варіантів моделі.

Як це змінить ваш ринок?

Для фінансових установ це означає можливість виконувати складний аналіз транзакцій і ризиків без передачі даних у хмари західних провайдерів, що знижує регуляторні бар’єри та витрати на compliance. Для медіа‑компаній довгі контекстні вікна дозволяють автоматизувати створення довгих статей і сценаріїв, скорочуючи час виробництва.

Визначення: Sparse Attention — механізм, який обирає підмножину токенів для обчислення уваги, зменшуючи вимоги до пам'яті.

Для кого це і за яких умов

•7B модель: ноутбук MacBook 16 GB, без IT‑команди, розгортання за 15 хв.
•27B модель: GPU 24 GB+ (вартість $2 000+) або хмара ~$0.5/год, IT‑спеціаліст, 1‑2 дні на налаштування.
•Мінімальний масштаб: MID_50 (компанії з 50+ співробітниками або значними даними).

Альтернативи

Продукт	Ціна (за 1M токенів)	Де працює	Мін. вимоги	Ключова різниця
OpenAI GPT‑4o	$5	Хмара	Інтернет	Найвища якість, висока вартість
Anthropic Claude 2	$3	Хмара	Інтернет	Краща безпека, обмежений контекст
LongCat 2.0	$0.75/$3	Самостійно/Хмара	GPU 24 GB+ або CPU для 7B	Відкритий код, великий контекст

На китайських чипах натренували першу велику LLM

🟢 МОЖЛИВОСТІ

🔴 ЗАГРОЗИ

🎯 Чи підходить це вашому бізнесу?

TL;DR

Як це змінить ваш ринок?

Для кого це і за яких умов

Альтернативи

Такий розбір щоранку о 08:00

Джерела

Навчіть вашу команду будувати такі AI-автоматизації