ПозитивнаImpact 7/10🚀 Early Adoption🏗️ Enterprise🏭 Виробництво і Промисловість📺 Медіа і Контент

OpenAI та Broadcom випустили чіп Jalapeño для LLM-моделей

Ооо нейромережеве🐱2 днi тому0 переглядів

OpenAI у партнерстві з Broadcom представила свій перший кастомний чіп під назвою «Jalapeño», призначений для запуску великих мовних моделей. Цей крок дозволить OpenAI розгортати потужніші моделі та потенційно запобігти деградації старих версій, що є критичним для стабільності та розвитку їхніх AI-продуктів.

ВердиктПозитивнаImpact 7/10

🚀 Прорив в інфраструктурі AI. Зміцнює позиції OpenAI та зменшує залежність від сторонніх виробників GPU, що критично для великих AI-компаній.

🟢 МОЖЛИВОСТІ

  • Зниження операційних витрат OpenAI на інференс LLM в довгостроковій перспективі.
  • Можливість розгортання потужніших та складніших моделей AI, що розширить спектр застосувань.
  • Збільшення швидкості та ефективності обробки запитів, покращуючи користувацький досвід.

🔴 ЗАГРОЗИ

  • Високі початкові інвестиції в R&D та виробництво власного чіпа.
  • Ризик відставання від темпів інновацій Nvidia, якщо власна розробка не буде достатньо гнучкою.
  • Залежність від Broadcom як партнера у виробництві, що може створити нові вузькі місця.

🎯 Чи підходить це вашому бізнесу?

Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.

Заповнити профіль · 30 секунд
Детальний розбір ↓

TL;DR

  • Чіп «Jalapeño» розроблено спеціально для інференсу LLM-моделей OpenAI.
  • Розробка чіпа зайняла всього 9 місяців.
  • Його потужність, за чутками, може бути на рівні або вище Nvidia Blackwell.
  • Партнерство з Broadcom дозволило OpenAI створити власне апаратне рішення.
  • Мета — оптимізація витрат та продуктивності для майбутніх моделей OpenAI.

Як це змінить ваш ринок?

Ця подія знаменує собою важливий крок у стратегії вертикальної інтеграції для великих AI-компаній. Для ринку це означає потенційне зниження вартості використання потужних LLM-моделей у довгостроковій перспективі, що зробить їх доступнішими для ширшого кола бізнесів. Компанії, що сильно залежать від AI-інференсу, можуть отримати вигоду від стабільніших цін та вищої продуктивності, оскільки OpenAI зменшує свою залежність від зовнішніх постачальників GPU.

Визначення: Інференс (Inference) — процес використання навченої моделі штучного інтелекту для прийняття рішень або генерації прогнозів на нових даних.

Для кого це і за яких умов

Ця новина є критично важливою для керівників та IT-директорів великих технологічних компаній, які вже активно використовують або планують масштабне впровадження LLM-моделей. Вона вказує на майбутні зміни в ціновій політиці та доступності AI-ресурсів. Для компаній, що розробляють власні AI-рішення, це сигнал про посилення конкуренції та необхідність розглядати власні апаратні оптимізації. Мінімальні вимоги для відчуття впливу — це значні обсяги AI-інференсу, що зазвичай притаманно підприємствам рівня ENTERPRISE_1000.

Альтернативи

Nvidia H100Google TPU v5eAWS Inferentia2
ЦінаВід $30,000 за картуХмарний доступ, ціна за використанняХмарний доступ, ціна за використання
Де працюєЛокально, хмараХмара (Google Cloud)Хмара (AWS)
Мін. вимогиВисокі енергетичні та охолоджувальні вимогиІнтеграція з Google CloudІнтеграція з AWS
Ключова різницяЗагального призначення GPU, лідер ринкуСпеціалізований для ML, висока ефективністьОптимізований для інференсу, низька вартість

💬 Часті запитання

OpenAI прагне зменшити свою залежність від зовнішніх постачальників GPU, таких як Nvidia, що дозволить їм краще контролювати витрати, оптимізувати продуктивність своїх моделей та забезпечити стабільність поставок для своїх зростаючих потреб.

Такий розбір щоранку о 08:00

Персональний AI-дайджест для вашої галузі — щодня у Telegram

7 днів безкоштовно
OpenAIBroadcomJalapeñoLLMchipAIhardwarecustomsiliconNvidiaBlackwellAIinfrastructure

Навчіть вашу команду будувати такі AI-автоматизації

За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.

Дізнатись більше → aiupskill.live