Perplexity опублікувала рецепт постобробки пошукового агента на Qwen3.5
Perplexity AI опублікувала технічний звіт про створення пошукового веб-агента на базі відкритих моделей Qwen3.5. Qwen3.5-397B-SFT-RL досягає 73,9% точності на FRAMES за ціною $0,02 за запит, перевершуючи GPT-5.4 і Sonnet 4.6 за точністю та вартістю.
🔬 Цікаве дослідження. Perplexity показує, як можна ефективно використовувати open-source моделі для пошукових агентів, але потрібні значні обчислювальні ресурси для навчання.
🟢 МОЖЛИВОСТІ
- Зниження витрат на пошук завдяки використанню Qwen3.5 (до 4 разів дешевше, ніж GPT-5.4)
- Можливість кастомізації та fine-tuning моделі під конкретні потреби
- Підвищення конфіденційності даних, оскільки модель може бути розгорнута локально
🔴 ЗАГРОЗИ
- Потреба у значних обчислювальних ресурсах для навчання та інференсу (GPU A10B або A17B)
- Складність відтворення результатів без доступу до внутрішніх оптимізацій Perplexity
- Ризик погіршення якості пошуку при неправильному налаштуванні SFT та RL
🎯 Чи підходить це вашому бізнесу?
Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.
Заповнити профіль · 30 секундTL;DR
- •Perplexity використовує Qwen3.5-122B-A10B та Qwen3.5-397B-A17B.
- •Qwen3.5-397B-SFT-RL досягає 73,9% точності на FRAMES.
- •Вартість запиту $0,02.
- •Використовується двохетапний пайплайн: SFT та RL.
- •Дані для RL зібрані з синтетичних багатошагових питань та діалогів загального призначення.
Як це змінить ваш ринок?
Для медіа та контент-агрегаторів це відкриває можливість створення власних пошукових інструментів на базі AI без значних витрат на API великих мовних моделей, що знімає блокер у масштабуванні контентних проєктів.
SFT (Supervised Fine-Tuning) — метод навчання мовної моделі на розмічених даних для покращення її продуктивності у конкретних задачах.
Для кого це і за яких умов
7B: потрібен IT-спеціаліст, 1-2 дні на розгортання, GPU A10B або A17B.
Альтернативи
| Perplexity Qwen3.5 | GPT-5.4 | Sonnet 4.6 | |
|---|---|---|---|
| Ціна | $0.02/запит | $0.085/запит | $0.153/запит |
| Де працює | Локально/Хмара | API | API |
| Мін. вимоги | GPU A10B/A17B | API ключ | API ключ |
| Ключова різниця | Відкритий код, локальне розгортання | Пропрієтарна модель, висока якість | Пропрієтарна модель, збалансована якість та швидкість |
💬 Часті запитання
Такий розбір щоранку о 08:00
Персональний AI-дайджест для вашої галузі — щодня у Telegram
Джерела
Machinelearning — оригіналНавчіть вашу команду будувати такі AI-автоматизації
За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.
Дізнатись більше → aiupskill.live