Які GPU підтримуються CODA?

CODA розроблена для GPU NVIDIA з підтримкою CUDA.

Чи можна використовувати CODA з PyTorch або TensorFlow?

Так, CODA можна інтегрувати з PyTorch та TensorFlow, але це потребує додаткової розробки.

Який приріст продуктивності можна очікувати від CODA?

Приріст продуктивності залежить від конкретної архітектури GPU та розміру моделі, але в деяких випадках можна очікувати збільшення швидкості навчання на 20-30%.

CODA: Переписані блоки Transformer як GEMM-epilogue програми

TL;DR

•CODA переписує Transformer оператори як GEMM-plus-epilogue програми.
•Зменшує вузькі місця, пов'язані з пам'яттю, на GPU.
•Виконує обчислення, не пов'язані з увагою, поки вихідні плитки GEMM залишаються на чипі.
•Оптимізація може значно прискорити навчання та виведення моделей Transformer на GPU.
•Ефективність залежить від конкретної архітектури GPU та розміру моделі.

Як це змінить ваш ринок?

У фінансовій індустрії, де швидкість обробки даних є критичною, CODA може дозволити банкам та іншим фінансовим установам швидше навчати та розгортати моделі машинного навчання для виявлення шахрайства, оцінки ризиків та інших завдань. Це знімає блокер, пов'язаний з високими обчислювальними витратами.

GEMM (General Matrix Multiplication) — базова операція лінійної алгебри, яка широко використовується в машинному навчанні, особливо в нейронних мережах.

Для кого це і за яких умов

Для компаній, які мають великі обсяги даних та потребують високої продуктивності для навчання та виведення моделей Transformer. Потрібна команда розробників з досвідом роботи з GPU та фреймворками машинного навчання. Для тестування та інтеграції CODA може знадобитися від кількох тижнів до кількох місяців.

Альтернативи

	CODA	NVIDIA cuBLAS	Intel MKL
Ціна	Безкоштовно (дослідження)	Включено в NVIDIA SDK (платно)	Включено в Intel oneAPI (платно)
Де працює	GPU NVIDIA	GPU NVIDIA	CPU Intel
Мін. вимоги	GPU NVIDIA з CUDA	GPU NVIDIA з CUDA	CPU Intel з підтримкою AVX2
Ключова різниця	Оптимізація для Transformer блоків	Загальна бібліотека лінійної алгебри	Загальна бібліотека лінійної алгебри для CPU

CODA: Переписані блоки Transformer як GEMM-epilogue програми

🟢 МОЖЛИВОСТІ

🔴 ЗАГРОЗИ

🎯 Чи підходить це вашому бізнесу?

TL;DR

Як це змінить ваш ринок?

Для кого це і за яких умов

Альтернативи

💬 Часті запитання

Такий розбір щоранку о 08:00

Джерела

Навчіть вашу команду будувати такі AI-автоматизації