xAI тихо випустила Grok 4.3 у ранній бета-версії. Це нова модель з 0.5T параметрів та знаннями до грудня 2025. Ілон Маск анонсував Grok 4.4 (1T параметрів) та Grok 4.5 (1.5T параметрів) у травні, а також внутрішню "фабрику моделей" для оновлень кожні два тижні.
Шахи у стилі Гаррі Поттера тепер мають вбудований штучний інтелект. Гравці можуть змагатися з ШІ на різних рівнях складності або грати проти інших людей онлайн.
Представлено фреймворк для аналізу відеопотоків у реальному часі, що дозволяє визначати власні концепти та ідентифікувати їх з таймкодами. Він може відповідати на питання по відео, навіть про минулі моменти, працюючи як надбудова над VLM без додаткового навчання, перетворюючи відео на базу даних з можливістю пошуку.
Платформа аватарів HeyGen оновилася до 5-ї версії, скоротивши вимоги до відео для навчання моделі до 15 секунд. Оновлення дозволяє переносити «руховий підпис» користувача з референсного відео на інші версії аватара з різним одягом, фоном і форматом кадру.
Вийшов LTX 2.3 IC-LoRA EditAnything, інструмент для редагування зображень з використанням LoRA моделей. Це дозволяє локально маніпулювати зображеннями, пропонуючи альтернативу хмарним рішенням і підвищуючи конфіденційність.
Anthropic випустила Claude Design, інструмент на основі AI, який перетворює чат на повноцінне середовище для дизайну. Система автоматично наслідує брендбук організації, застосовуючи його до всіх нових макетів, що спрощує процес проєктування.
Anthropic випустила Claude Design, інструмент для генерації сайтів, презентацій та моушн-відео на основі дизайн-систем. Ключем є файл DESIGN.md, що описує дизайн-систему для різних форматів, дозволяючи генерувати матеріали у стилі бренду.
Представлено CompHairHead, метод створення 3D-аватарів голови з реалістичним волоссям на основі однієї фотографії. Технологія дозволяє генерувати аватари в реальному часі з динамічною поведінкою волосся, що відкриває нові можливості для ігор та віртуальної реальності.
Автор стверджує, що використання LLM для парсингу новин через API значно ефективніше за OpenCL з точки зору витрат токенів. Це вказує на потенційну економію коштів і підвищення продуктивності в агрегації та аналізі новин.
Випущено нову японську базову модель RoBERTa, попередньо навчену на японській Вікіпедії та CC-100. Модель має 32 000 токенів і можливості тонкого налаштування. Це дозволить розробникам створювати більш точні та ефективні додатки для обробки природної мови японською.
Інструмент Anima Agent дозволяє швидко переносити дизайни з Claude Design у редаговані шари Figma. Це спрощує робочий процес для дизайнерів та економить час.
Deemos Tech представила Sato, новий AI-інструмент для автоматичної генерації UV-розгорток 3D-моделей. Це дозволить автоматизувати процес створення UV-розгорток, що є важливим етапом у 3D-моделюванні, та прискорити роботу художників.
WaiCompass — це застосунок на основі AI, який пропонує унікальні та незвичайні місця для відвідування, маючи в базі понад 1000 локацій у 70+ країнах. AI рекомендує напрямки на основі вподобань користувача та навіть пропонує випадкові місця одним струшуванням телефону.
OpenAI оновила свою Pro модель до версії 5.5, що призвело до збільшення швидкості та покращення можливостей програмування. Оновлена модель тепер може генерувати веб-ігри з простих запитів, демонструючи покращену обробку графіки.
У статті розглядається феномен «зловісної долини» в контексті штучного інтелекту та зростання негативного ставлення до нього. Аналізуються психологічні та соціальні фактори, що сприяють цьому занепокоєнню. Це може призвести до сповільнення впровадження корисних AI-інструментів через суспільний опір.
У статті аналізується Claude Design від Anthropic, ставлячи під сумнів його здатність зруйнувати ринок інструментів дизайну, де домінує Figma. Зроблено висновок, що Claude Design, швидше за все, є нішевим продуктом для існуючих користувачів Claude, а не вбивцею Figma.
На Reddit з'явився пост, який гумористично відображає загальні настрої та обговорення навколо великих мовних моделей (LLM) у Twitter. Це показує, як широка публіка сприймає та розуміє AI-технології.
OpenAI активно шукає нові шляхи розвитку, про що свідчать останні придбання. Експерти ставлять під сумнів, чи допоможуть ці кроки компанії вирішити фундаментальні проблеми виживання на ринку.
Стаття розглядає ризик генерації AI-моделями неприйнятного контенту, якщо їх навчають на даних, створених користувачами, що містять образливі матеріали. Це підкреслює важливість ретельного відбору даних і заходів безпеки в розробці AI.
15-річний підліток нібито заробив десятки тисяч доларів на Amazon Kindle Unlimited, використовуючи згенеровані AI книги та ботів для імітації читання. Це призвело до значних прибутків, але також зашкодило реальним авторам, змусивши Amazon посилити правила.
Користувачі скаржаться, що Opus 4.7, на відміну від 4.6, видає безглузді результати, галюцинує та генерує надмірно довгі відповіді. Шукають способи вирішення цих проблем.
Користувач ділиться досвідом інтеграції AI в Canva, зазначаючи, що власні інструменти дизайну Canva спочатку перевершували Claude. Користувач сподівається на покращення можливостей дизайну Claude в Canva та висловлює бажання автоматизувати генерацію та публікацію дизайнів.
Bloomberg повідомляє про затримку оновлення Mac Studio до жовтня. Це ускладнить локальну розробку LLM, оскільки розробники покладаються на Mac Studio для тестування та оптимізації моделей.
Автор ділиться порадами щодо ефективного використання Claude Design, зокрема використання Opus для початкових промптів, Sonnet для редагувань і прямої інтеграції з кодом. Підкреслюється здатність Claude витягувати дизайн-системи з кодових баз, забезпечуючи узгодженість бренду.
Випущено ваги AI-моделі AceStep 1.5 XL у форматах ComfyOrg (bf16), GGUF та NVFP4. Це розширює можливості використання моделі у різних застосунках, особливо для редагування музики, та робить її доступнішою.
Автор ділиться списком з 10 ресурсів для вивчення AI, серед яких Zvi Mowshowitz та AI Futures Project. Це допоможе залишатися в курсі трендів та робити обґрунтовані прогнози щодо розвитку технологій.
Нова версія GPT, а саме GPT-5.5, за чутками, тестується в ChatGPT. У статті представлені приклади можливостей цієї моделі, що викликає ажіотаж та очікування офіційного релізу. Це може змінити конкурентний ландшафт ринку великих мовних моделей.
Вікторія Боня опублікувала вірусне відео, де за допомогою AI приміряє образ Людини-павука та «розправляється» з публічними опонентами. Згенероване AI відео набрало шість мільйонів переглядів та понад 300 тисяч лайків, демонструючи можливості генеративного контенту для залучення аудиторії.
Метт Мулленвег скасував рішення основних розробників, щоб включити Akismet до екрану Connectors у WordPress 7.0. Це рішення змінює попереднє і може вплинути на те, як користувачі WordPress керують фільтрацією спаму.
Креативна індустрія кидає виклик домінуванню Adobe, пропонуючи альтернативні інструменти. Це може змусити Adobe знизити ціни або втратити частку ринку.
Стаття обговорює можливості генерації гумору моделями штучного інтелекту Codex 5.3 Spark та Gemini 3 Flash. Підкреслюється різниця між жартами, згенерованими ШІ, та класичними жартами, знайденими у навчальних даних. Це показує, як ШІ може відтворювати існуючий гумор, але не завжди створює оригінальний.
Anthropic представила Claude Design, платформу для дизайну на основі Opus 4.7, що конкурує з Figma. Платформа використовує детальну анкету для генерації чернеток дизайну, пропонуючи користувачам чотири початкові варіанти для подальшого вдосконалення.
Співробітник X натякнув на оновлення GPT 5.4 PRO, що викликало спекуляції про приховану фазу тестування GPT 5.5. Користувачі сперечаються, чи це оновлення, чи прихований погляд на модель наступного покоління.
ElevenLabs пропонує локальне розгортання моделей для серверів з GPU та edge-пристроїв з NPU. Це дозволяє обробляти аудіо всередині інфраструктури клієнта, зменшуючи залежність від хмарних сервісів та підвищуючи контроль над даними.
Anthropic випустила Claude Design, інструмент для створення UI/UX дизайнів та презентацій. Зараз продукт на стадії "Research Preview" з обмеженим використанням, але вже має корисні функції.
Японці розробили систему "Fencing Visualized" на основі AI, яка використовує комп'ютерний зір для відстеження рухів шпаг та створення кольорових шлейфів у реальному часі. Це покращує досвід перегляду, роблячи швидкі дії у спорті більш зрозумілими.
Американський стартап запустив платні відеодзвінки з Ісусом, згенерованим штучним інтелектом. За 2 долари на хвилину користувачі можуть отримати поради та розраду, а Ісус на основі нейромережі пам'ятає попередні розмови.
EvoLinkAI випустила репозиторій промптів для GPT-Image-2, щоб полегшити створення якісних зображень. Це дозволить користувачам швидше знаходити потрібні промпти та надихатися на нові ідеї, заощаджуючи час та ресурси.
Kiri Engine випустила оновлення Gaussian Splatting to Mesh, що покращує обробку дрібних деталей та швидкість. Це дозволить створювати більш реалістичні 3D-моделі з меншими витратами ресурсів, відкриваючи нові можливості для мобільної сцени та AR/VR.
Розробник виявив, що простий shell-скрипт на 113 рядків під назвою Ralph, у поєднанні з Claude, перевершує інші інструменти для агентних циклів. Ralph використовує markdown-промпти для перетворення вимог у PRD, а потім у плани задач.
ElevenLabs відкрила ранній доступ до локального розгортання своїх AI-моделей. Це дозволить компаніям запускати моделі у власній інфраструктурі, що дає більший контроль над конфіденційністю даних та можливістю кастомізації.
Блогери використовують AI-агентів для розробки продуктів, де один агент пише фронтенд, а інший паралельно працює над бекендом. Це може значно прискорити розробку та знизити бар'єр для створення програмних продуктів.
У статті розглядаються механізми sparse векторів SPLADE та bge-m3, пояснюючи, що це не традиційні методи повнотекстового пошуку. Роз'яснюється, як ці вектори, згенеровані за допомогою моделей-трансформерів, кодують семантичні зв'язки між токенами, а не просту присутність або частоту токенів.
Офіційно випущено кастомні ноди JoyAI-Image для ComfyUI. Ці ноди призначені для генерації зображень з тексту та редагування зображень у середовищі ComfyUI.
Проєкт «Нейропросвіта», тісно пов'язаний з нейромережами, досяг прибутку в 1 мільйон рублів всього за чотири дні. Це підкреслює зростаючий потенціал AI-проєктів та збільшення прийняття AI-технологій у бізнесі.
Adobe представила Firefly AI Assistant, який дозволяє описувати бажаний результат, а асистент сам визначає, які інструменти використовувати. Оновлення також включає покращення відеоредактора Firefly та нові моделі генерації відео, що спростить роботу з графікою та відео для маркетологів.
Вийшла нова Lora модель 'Edit Anything' для редагування відео. Вона дозволяє замінювати, видаляти, додавати та стилізувати об'єкти, що спрощує постобробку відеоконтенту.
Наступного тижня очікується реліз GPT 5.5, що включатиме версії GPT 5.5 Thinking та GPT 5.5 Pro. Автор ділиться інсайдерською інформацією та закликає не втрачати надію, хоча GPT 5o ще не готовий.
Пісня, створена за допомогою Suno AI, а візуал згенеровано ChatGPT та приписано вигаданій виконавиці IngaRose, очолила чарти iTunes. Трек отримав сотні тисяч лайків і тисячі коментарів, демонструючи зростаючий вплив AI у створенні музики.