Чи буде чіп Jalapeño доступний для інших компаній?

Наразі інформація про доступність чіпа Jalapeño для сторонніх компаній не розкрита. Ймовірно, він буде використовуватися виключно для внутрішніх потреб OpenAI, щоб забезпечити конкурентну перевагу.

Як це вплине на вартість використання LLM від OpenAI?

У довгостроковій перспективі розробка власних чіпів може призвести до зниження операційних витрат OpenAI, що потенційно може відобразитися на більш конкурентних цінах для користувачів їхніх API та сервісів. Однак короткостроковий вплив на ціни не очікується.

OpenAI та Broadcom випустили чіп Jalapeño для LLM-моделей

TL;DR

•Чіп «Jalapeño» розроблено спеціально для інференсу LLM-моделей OpenAI.
•Розробка чіпа зайняла всього 9 місяців.
•Його потужність, за чутками, може бути на рівні або вище Nvidia Blackwell.
•Партнерство з Broadcom дозволило OpenAI створити власне апаратне рішення.
•Мета — оптимізація витрат та продуктивності для майбутніх моделей OpenAI.

Як це змінить ваш ринок?

Ця подія знаменує собою важливий крок у стратегії вертикальної інтеграції для великих AI-компаній. Для ринку це означає потенційне зниження вартості використання потужних LLM-моделей у довгостроковій перспективі, що зробить їх доступнішими для ширшого кола бізнесів. Компанії, що сильно залежать від AI-інференсу, можуть отримати вигоду від стабільніших цін та вищої продуктивності, оскільки OpenAI зменшує свою залежність від зовнішніх постачальників GPU.

Визначення: Інференс (Inference) — процес використання навченої моделі штучного інтелекту для прийняття рішень або генерації прогнозів на нових даних.

Для кого це і за яких умов

Ця новина є критично важливою для керівників та IT-директорів великих технологічних компаній, які вже активно використовують або планують масштабне впровадження LLM-моделей. Вона вказує на майбутні зміни в ціновій політиці та доступності AI-ресурсів. Для компаній, що розробляють власні AI-рішення, це сигнал про посилення конкуренції та необхідність розглядати власні апаратні оптимізації. Мінімальні вимоги для відчуття впливу — це значні обсяги AI-інференсу, що зазвичай притаманно підприємствам рівня ENTERPRISE_1000.

Альтернативи

	Nvidia H100	Google TPU v5e	AWS Inferentia2
Ціна	Від $30,000 за карту	Хмарний доступ, ціна за використання	Хмарний доступ, ціна за використання
Де працює	Локально, хмара	Хмара (Google Cloud)	Хмара (AWS)
Мін. вимоги	Високі енергетичні та охолоджувальні вимоги	Інтеграція з Google Cloud	Інтеграція з AWS
Ключова різниця	Загального призначення GPU, лідер ринку	Спеціалізований для ML, висока ефективність	Оптимізований для інференсу, низька вартість

💬 Часті запитання

OpenAI прагне зменшити свою залежність від зовнішніх постачальників GPU, таких як Nvidia, що дозволить їм краще контролювати витрати, оптимізувати продуктивність своїх моделей та забезпечити стабільність поставок для своїх зростаючих потреб.

OpenAI та Broadcom випустили чіп Jalapeño для LLM-моделей

🟢 МОЖЛИВОСТІ

🔴 ЗАГРОЗИ

🎯 Чи підходить це вашому бізнесу?

TL;DR

Як це змінить ваш ринок?

Для кого це і за яких умов

Альтернативи

💬 Часті запитання

Такий розбір щоранку о 08:00

Джерела

Навчіть вашу команду будувати такі AI-автоматизації