Які дані використовуються для RL?

Використовуються синтетичні багатошагові питання з перевіреною відповіддю та діалоги загального призначення.

Які переваги використання Qwen3.5 порівняно з GPT-5.4?

Qwen3.5 дозволяє знизити витрати на пошук та забезпечує більшу конфіденційність даних завдяки можливості локального розгортання.

Perplexity опублікувала рецепт постобробки пошукового агента на Qwen3.5

TL;DR

•Perplexity використовує Qwen3.5-122B-A10B та Qwen3.5-397B-A17B.
•Qwen3.5-397B-SFT-RL досягає 73,9% точності на FRAMES.
•Вартість запиту $0,02.
•Використовується двохетапний пайплайн: SFT та RL.
•Дані для RL зібрані з синтетичних багатошагових питань та діалогів загального призначення.

Як це змінить ваш ринок?

Для медіа та контент-агрегаторів це відкриває можливість створення власних пошукових інструментів на базі AI без значних витрат на API великих мовних моделей, що знімає блокер у масштабуванні контентних проєктів.

SFT (Supervised Fine-Tuning) — метод навчання мовної моделі на розмічених даних для покращення її продуктивності у конкретних задачах.

Для кого це і за яких умов

7B: потрібен IT-спеціаліст, 1-2 дні на розгортання, GPU A10B або A17B.

Альтернативи

	Perplexity Qwen3.5	GPT-5.4	Sonnet 4.6
Ціна	$0.02/запит	$0.085/запит	$0.153/запит
Де працює	Локально/Хмара	API	API
Мін. вимоги	GPU A10B/A17B	API ключ	API ключ
Ключова різниця	Відкритий код, локальне розгортання	Пропрієтарна модель, висока якість	Пропрієтарна модель, збалансована якість та швидкість

💬 Часті запитання

Спочатку SFT закріплює цільову поведінку, а потім RL відточує точність пошуку та ефективність викликів інструментів.

Perplexity опублікувала рецепт постобробки пошукового агента на Qwen3.5

🟢 МОЖЛИВОСТІ

🔴 ЗАГРОЗИ

🎯 Чи підходить це вашому бізнесу?

TL;DR

Як це змінить ваш ринок?

Для кого це і за яких умов

Альтернативи

💬 Часті запитання

Такий розбір щоранку о 08:00

Джерела

Навчіть вашу команду будувати такі AI-автоматизації