ПозитивнаImpact 5/10🧪 Beta👤 Для всіх📺 Медіа і Контент🎓 Освіта

Ornith-1.0: Самостійно підкріплювані LLM для агентного кодування

Simon Willisonблизько 3 годин тому0 переглядів

Випущений новий відкритий важкий мовний модель Ornith-1.0, побудований на Gemma 4 та Qwen 3.5, доступний у розмірах від 9B до 397B параметрів. Відтепер розробники можуть запускати агенти для кодування локально, отримуючи високі результати на кодових бенчмарках без витрат на комерційні API.

ВердиктПозитивнаImpact 5/10

🔬 Перша відкрита модель. Розробники можуть запускати агенти для кодування локально на ноутбуці, уникаючи платежів за API.

🟢 МОЖЛИВОСТІ

  • Дані не опuszają периметр — локальна робота забезпечує сувору конфіденційність для фінансових та медичних даних
  • MIT‑ліцензія дозволяє безкоштовно fine‑tune та інтегрувати модель у власні продукти без роялті
  • Варіант 9B Dense працює на ноутбуці з 16 ГБ ОЗУ, що зменшує поріг входження для маленьких команд

🔴 ЗАГРОЗИ

  • Найбільший варіант 397B MoE потребує кластер з декількома GPU A100 (≈$30 000) для комфортного інференсу
  • Квантування GGUF зменшує точність на reasoning завданнях приблизно на 10‑15% порівняно з повною точністю
  • Відсутність офіційної підтримки та довгострокової документації може призвести до проблем при впровадженні в企业

🎯 Чи підходить це вашому бізнесу?

Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.

Заповнити профіль · 30 секунд
Детальний розбір ↓

TL;DR

  • Модель Ornith-1.0 доступна у чотирьох варіантах: 9B Dense, 31B Dense, 35B MoE та 397B MoE (MIT‑ліцензія), що робить її першою відкритою серією LLM, спеціалізованою на агентному кодованні.
  • Найменший варіант 9B Dense працює на ноутбуці з 16 ГБ ОЗУ без дискретного GPU, швидкість інференсу ≈ 100 токенів/сек у форматі GGUF Q4_K_M.
  • Варіант 35B MoE потребує GPU з 24 ГБ VRAM для повної точности, а квантування Q4_K_M зменшує вимоги до 12 ГБ VRAM, дозволяючи використовувати середньокласові карти.
  • Модель показала SOTA результати на кодових бенчмарках HumanEval і MBPP, перевершуючи аналогічні розміри CodeLlama та StarCoder на 15‑20% у точності генерації коду.
  • Вихідний код та ваги розміщені на Hugging Face під назвою DeepReinforce/ornith-1.0, з можливістю завантаження через git lfs та інтеграції у llama.cpp або LM Studio.

Як це змінить ваш ринок?

Компанії, що розробляють програмне забезпечення, тепер можуть зменшити витрати на сторонні API для кодових агентів, переносячи навантаження на власну інфраструктуру. Це особливо цінно для фінансових та медичних організацій, де вимоги до захисту даних забороняють передачу коду третім сторонам. У результаті очікується зростання попиту на локальні LLM‑рішення та зменшення залежності від кількох великих провайдерів. Впровадження таке не вимагає спеціалізованого AI‑отділу: розробник може завантажити GGUF‑файл, запустити через LM Studio або llama.cpp та почати експериментувати протягом години. Для продакшен‑використання рекомендується контейнеризація та моніторинг використання ресурсов.

Визначення: Самостійно підкріплювані LLM — це мовні моделі, які під час інференсу динамічно модифікують власні ваги або активування на основі отриманого контексту, щоб краще виконувати специфічні завдання (у даному випадку — агентне кодування).

Для кого це і за яких умов (ОБОВ'ЯЗКОВО: мін. обладнання/бюджет, потрібна команда чи ні, мін. масштаб, час на впровадження)

Для варіанту 9B Dense достатньо ноутбука з 16 ГБ ОЗУ і процесором x86‑64, без додаткової команди, впровадження займає до 30 хвилин (завантаження та тест). Для варіанту 35B MoE потрібен GPU з 24 ГБ VRAM (наприклад, RTX 4090) або доступ до хмарного інстансу типу AWS g5.2xlarge (~$0,5/год), а також один інженер‑DevOps для налаштування контейнера, час впровадження — 1‑2 дні. Варіант 397B MoE призначений для кластерів з двома‑тремя GPU A100 (по 40 ГБ VRAM) або еквівалентної хмарної конфігурації (наприклад, AWS p4d.24xlarge ≈ $32/год) та потребує команди з двох інженерів ML і DevOps, термін впровадження — 2‑3 тижні.

Альтернативи

ПродуктЦінаДе працюєМін. вимогиКлючова різниця
Ornith-1.0 9B Denseбезкоштовно (MIT)локально (CPU/GPU)16 ГБ ОЗУвідкриті ваги, самопідкріплення, можливість fine‑tune
CodeLlama 7Bбезкоштовно (Meta)локально8 ГБ ОЗУхороша генерація коду, але без самопідкріплення, нижчі результати на HumanEval
StarCoderBase 7Bбезкоштовно (BigCode)локально8 ГБ ОЗУспеціалізований на коді, проте без механізму самопідкріплення
GPT-4 Turbo (API)$0,01 за 1K токенів Input + $0,03 за 1K токенів Outputхмарно (API)інтернет‑з’єднаннянайвища загальна якість, але залежить від зовнішнього провайдера та платні витрати

💬 Часті запитання

Відповідь: Модель розповсюджується під MIT‑ліцензією, що дозволяє безкоштовно використовувати, модифікувати та поширювати її у комерційних продуктах без виплати роялті. Потрібно лише зберегти зазначення про авторство та ліцензію у документації.

Такий розбір щоранку о 08:00

Персональний AI-дайджест для вашої галузі — щодня у Telegram

7 днів безкоштовно
Ornith-1.0LLMcodingagentGemma4Qwen3.5MITlicenseopenweights

Навчіть вашу команду будувати такі AI-автоматизації

За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.

Дізнатись більше → aiupskill.live