Які вимоги до обладнання для запуску SubQ?

Вимоги до обладнання поки невідомі. Розробники заявляють про можливість запуску на менш потужному обладнанні завдяки sparse-attention.

Чи буде модель опенсорс?

Інформація про ліцензію моделі поки не розголошується. Потрібно дочекатись офіційного анонсу.

Стартап Subquadratic анонсував мовну модель SubQ з контекстним вікном 12M токенів

TL;DR

•Контекстне вікно 12M токенів.
•Швидкість 150 токенів/сек.
•Використовує sub-quadratic sparse-attention.
•Перевершує Claude Opus 4.6 на SWE-bench (за словами розробників).
•Вартість інференсу 5% від Claude Opus.

Як це змінить ваш ринок?

Для компаній, які використовують великі мовні моделі для обробки текстів, нова модель може значно знизити витрати на інференс. Це знімає блокер для впровадження AI у сферах, де обробка великих обсягів даних є критичною, наприклад, у фінансах та юриспруденції.

Sparse-attention — механізм уваги, який обчислює зв'язки лише для обмеженого набору найбільш важливих елементів, а не для всієї матриці.

Для кого це і за яких умов

Потрібно дочекатись публічного API та незалежних тестів. Якщо заявлена продуктивність підтвердиться, модель буде цікава компаніям, які використовують LLM у великих обсягах. Для тестування знадобиться IT-спеціаліст та GPU.

Альтернативи

	Claude Opus 4.6	GPT-4o	SubQ (за заявою)
Ціна	$15/1M токенів	$5/1M токенів	$0.75/1M токенів
Де працює	Хмара	Хмара	Локально (потенційно)
Мін. вимоги	API	API	GPU (потенційно)
Ключова різниця	Production-ready	Production-ready	Експериментальна, низька вартість (за заявою)

💬 Часті запитання

Наразі модель знаходиться у закритій бета-версії. Дата публічного запуску не оголошена.

Стартап Subquadratic анонсував мовну модель SubQ з контекстним вікном 12M токенів

🟢 МОЖЛИВОСТІ

🔴 ЗАГРОЗИ

🎯 Чи підходить це вашому бізнесу?

TL;DR

Як це змінить ваш ринок?

Для кого це і за яких умов

Альтернативи

💬 Часті запитання

Такий розбір щоранку о 08:00

Джерела

Навчіть вашу команду будувати такі AI-автоматизації