DeepSeek V4: майже топовий AI за значно нижчою ціною

Simon Willisonблизько 3 годин тому0 переглядів

Китайська AI-лабораторія DeepSeek випустила моделі серії V4, DeepSeek-V4-Pro та DeepSeek-V4-Flash, з контекстом в 1 мільйон токенів та архітектурою Mixture of Experts. DeepSeek-V4-Flash є найдешевшою з малих моделей, а DeepSeek-V4-Pro – найдешевшою з великих моделей топового рівня. Це відкриває можливості для компаній, які хочуть використовувати передові AI-моделі, не переплачуючи за дорогі API.

ВердиктПозитивнаImpact 6/10

🚀 Конкуренція зростає. DeepSeek пропонує топові моделі за ціною в 2-3 рази нижчою за OpenAI — для тих, хто шукає альтернативу платним API.

🟢 МОЖЛИВОСТІ

  • Зниження витрат на inference в 2-3 рази порівняно з GPT-4o
  • Можливість запуску великих моделей локально (DeepSeek-V4-Flash)
  • Відкриті ваги для кастомізації та fine-tuning

🔴 ЗАГРОЗИ

  • Необхідність GPU з великим обсягом VRAM для DeepSeek-V4-Pro (24GB+)
  • Потенційна залежність від китайської компанії та її політики
  • Ризик нижчої продуктивності в деяких задачах порівняно з GPT-4o

🎯 Чи підходить це вашому бізнесу?

Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.

Заповнити профіль · 30 секунд
Детальний розбір ↓

TL;DR

  • DeepSeek-V4-Pro має 1.6T загальних параметрів, 49B активних.
  • DeepSeek-V4-Flash має 284B загальних параметрів, 13B активних.
  • Ціна DeepSeek V4 Flash: $0.14/мільйон токенів на вхід і $0.28/мільйон токенів на вихід.
  • Ціна DeepSeek V4 Pro: $1.74/мільйон токенів на вхід і $3.48/мільйон токенів на вихід.
  • DeepSeek-V4-Pro відстає від GPT-5.4 та Gemini-3.1-Pro на 3-6 місяців.

Як це змінить ваш ринок?

Маркетингові агенції зможуть значно знизити витрати на генерацію контенту, не втрачаючи в якості. Це знімає фінансовий блокер для широкого впровадження AI в маркетингу.

Inference: процес використання навченої моделі для отримання передбачень на нових даних.

Для кого це і за яких умов

7B: MacBook 16GB, без IT-команди, 15 хв. 27B: GPU $2,000+ або хмара ~$0.5/год, IT-спеціаліст, 1-2 дні.

Альтернативи

DeepSeek V4 FlashGPT-5.4 NanoGemini 3.1 Flash-Lite
Ціна$0.14/$0.28$0.20/$1.25$0.25/$1.50
Де працюєХмара, локальноХмараХмара
Мін. вимогиCPU, 8GB RAMХмараХмара
Ключова різницяНайнижча цінаЗбалансована ціна/якістьІнтеграція з Google Cloud

💬 Часті запитання

Для запуску DeepSeek-V4-Pro потрібна GPU з 24GB+ VRAM або хмарний сервіс з відповідною конфігурацією.

Такий розбір щоранку о 08:00

Персональний AI-дайджест для вашої галузі — щодня у Telegram

7 днів безкоштовно
DeepSeekLLMAIpricingopenweightsmodelMixtureofExperts

Навчіть вашу команду будувати такі AI-автоматизації

За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.

Дізнатись більше → aiupskill.live