ПозитивнаImpact 6/10🔬 Research👤 Для всіх📺 Медіа і Контент🛍️ eCommerce

Perplexity опублікувала рецепт постобробки пошукового агента на Qwen3.5

Machinelearningблизько 2 годин тому0 переглядів

Perplexity AI опублікувала технічний звіт про створення пошукового веб-агента на базі відкритих моделей Qwen3.5. Qwen3.5-397B-SFT-RL досягає 73,9% точності на FRAMES за ціною $0,02 за запит, перевершуючи GPT-5.4 і Sonnet 4.6 за точністю та вартістю.

ВердиктПозитивнаImpact 6/10

🔬 Цікаве дослідження. Perplexity показує, як можна ефективно використовувати open-source моделі для пошукових агентів, але потрібні значні обчислювальні ресурси для навчання.

🟢 МОЖЛИВОСТІ

  • Зниження витрат на пошук завдяки використанню Qwen3.5 (до 4 разів дешевше, ніж GPT-5.4)
  • Можливість кастомізації та fine-tuning моделі під конкретні потреби
  • Підвищення конфіденційності даних, оскільки модель може бути розгорнута локально

🔴 ЗАГРОЗИ

  • Потреба у значних обчислювальних ресурсах для навчання та інференсу (GPU A10B або A17B)
  • Складність відтворення результатів без доступу до внутрішніх оптимізацій Perplexity
  • Ризик погіршення якості пошуку при неправильному налаштуванні SFT та RL

🎯 Чи підходить це вашому бізнесу?

Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.

Заповнити профіль · 30 секунд
Детальний розбір ↓

TL;DR

  • Perplexity використовує Qwen3.5-122B-A10B та Qwen3.5-397B-A17B.
  • Qwen3.5-397B-SFT-RL досягає 73,9% точності на FRAMES.
  • Вартість запиту $0,02.
  • Використовується двохетапний пайплайн: SFT та RL.
  • Дані для RL зібрані з синтетичних багатошагових питань та діалогів загального призначення.

Як це змінить ваш ринок?

Для медіа та контент-агрегаторів це відкриває можливість створення власних пошукових інструментів на базі AI без значних витрат на API великих мовних моделей, що знімає блокер у масштабуванні контентних проєктів.

SFT (Supervised Fine-Tuning) — метод навчання мовної моделі на розмічених даних для покращення її продуктивності у конкретних задачах.

Для кого це і за яких умов

7B: потрібен IT-спеціаліст, 1-2 дні на розгортання, GPU A10B або A17B.

Альтернативи

Perplexity Qwen3.5GPT-5.4Sonnet 4.6
Ціна$0.02/запит$0.085/запит$0.153/запит
Де працюєЛокально/ХмараAPIAPI
Мін. вимогиGPU A10B/A17BAPI ключAPI ключ
Ключова різницяВідкритий код, локальне розгортанняПропрієтарна модель, висока якістьПропрієтарна модель, збалансована якість та швидкість

💬 Часті запитання

Спочатку SFT закріплює цільову поведінку, а потім RL відточує точність пошуку та ефективність викликів інструментів.

Такий розбір щоранку о 08:00

Персональний AI-дайджест для вашої галузі — щодня у Telegram

7 днів безкоштовно
PerplexityQwen3.5searchagentSFTRLGPT-5.4Sonnet4.6

Навчіть вашу команду будувати такі AI-автоматизації

За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.

Дізнатись більше → aiupskill.live