ПозитивнаImpact 5/10🚀 Early Adoption🏢 Від 50 людей

На китайських чипах натренували першу велику LLM

эйай ньюзблизько 2 годин тому1 перегляд

Meituan випустили LongCat 2.0 – 1,6 трильйона параметрів, навчений на 50 тисячах китайських чипів. Це важливо, бо відкриває можливість створювати масштабні LLM без Nvidia чи Google TPU.

ВердиктПозитивнаImpact 5/10

🚀 LongCat 2.0 — конкурентна альтернатива дорогим API для компаній, які мають власні ML‑команди та готові інвестувати у GPU‑інфраструктуру.

🟢 МОЖЛИВОСТІ

  • Внутрішнє розгортання без потреби у зовнішніх GPU‑хмарних провайдерах — зниження операційних витрат до 30 %.
  • Apache 2.0/MIT ліцензія дозволяє кастомізувати модель під специфічні галузеві вимоги без додаткових ліцензійних платежів.
  • Контекст до 1 млн токенів відкриває нові сценарії аналізу довгих документів та коду.

🔴 ЗАГРОЗИ

  • Навчання та інференс 27B‑моделі вимагає GPU 24 GB+ (вартість $2 000+), що обмежує доступність для середніх компаній.
  • Нестабільність кастомного Sparse Attention може призвести до непередбачуваних затримок у продуктивному середовищі.
  • Відсутність відкритих ваг для повної моделі — лише часткові релізи, що ускладнює повний аудит безпеки.

🎯 Чи підходить це вашому бізнесу?

Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.

Заповнити профіль · 30 секунд
Детальний розбір ↓

TL;DR

  • LongCat 2.0: 1,6 трильйона параметрів, 48 млрд активних.
  • Тренували на 35 трильйонах токенів, включаючи контекст до 1 млн токенів.
  • Ціна API $0.75 / $3 за мільйон токенів.
  • Ваги будуть випущені під Apache 2.0/MIT ліцензією.
  • Потреба у GPU 24 GB+ для великих варіантів моделі.

Як це змінить ваш ринок?

Для фінансових установ це означає можливість виконувати складний аналіз транзакцій і ризиків без передачі даних у хмари західних провайдерів, що знижує регуляторні бар’єри та витрати на compliance. Для медіа‑компаній довгі контекстні вікна дозволяють автоматизувати створення довгих статей і сценаріїв, скорочуючи час виробництва.

Визначення: Sparse Attention — механізм, який обирає підмножину токенів для обчислення уваги, зменшуючи вимоги до пам'яті.

Для кого це і за яких умов

  • 7B модель: ноутбук MacBook 16 GB, без IT‑команди, розгортання за 15 хв.
  • 27B модель: GPU 24 GB+ (вартість $2 000+) або хмара ~$0.5/год, IT‑спеціаліст, 1‑2 дні на налаштування.
  • Мінімальний масштаб: MID_50 (компанії з 50+ співробітниками або значними даними).

Альтернативи

ПродуктЦіна (за 1M токенів)Де працюєМін. вимогиКлючова різниця
OpenAI GPT‑4o$5ХмараІнтернетНайвища якість, висока вартість
Anthropic Claude 2$3ХмараІнтернетКраща безпека, обмежений контекст
LongCat 2.0$0.75/$3Самостійно/ХмараGPU 24 GB+ або CPU для 7BВідкритий код, великий контекст

Такий розбір щоранку о 08:00

Персональний AI-дайджест для вашої галузі — щодня у Telegram

7 днів безкоштовно
LLMMeituanChinesechipsLongCatSparseAttention

Навчіть вашу команду будувати такі AI-автоматизації

За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.

Дізнатись більше → aiupskill.live