В месенджер VK Max інтегровано крихітну нейромережу для розпізнавання ключових слів
У додатку VK Max виявлено інтеграцію невеликої нейромережі для розпізнавання ключових слів у реальному часі під час дзвінків. Модель BC-ResNet, розміром лише 1.17 МБ, наразі розпізнає тестову фразу "не слышу", але може бути оновлена для розпізнавання інших ключових слів і відправки повідомлень на сервери VK. Це відкриває можливості для моніторингу розмов, але викликає питання конфіденційності.
⚠️ Потенційний витік даних. Моніторинг розмов користувачів без їхньої згоди — ризик для репутації VK.
🟢 МОЖЛИВОСТІ
- Можливість моніторингу розмов для виявлення шахрайства (потрібна згода користувачів)
- Персоналізація контенту на основі розпізнаних ключових слів (згода обов'язкова)
- Автоматична транскрипція дзвінків для аналізу (згода обов'язкова)
🔴 ЗАГРОЗИ
- Ризик витоку особистих даних через несанкціонований моніторинг
- Штрафи за порушення GDPR та інших законів про захист даних
- Втрата довіри користувачів через приховані функції прослуховування
🎯 Чи підходить це вашому бізнесу?
Заповніть профіль компанії — і ми автоматично покажемо, чи варто вам це впроваджувати.
Заповнити профіль · 30 секундTL;DR
- •Додаток Max від VK використовує нейромережу BC-ResNet для розпізнавання ключових слів.
- •Розмір моделі – 1.17 МБ.
- •Працює в режимі реального часу (streaming).
- •Наразі розпізнає фразу "не слышу", але може бути оновлена.
- •Дані можуть передаватися на сервери VK.
Як це змінить ваш ринок?
Для медіа-компаній це відкриває можливості для моніторингу розмов користувачів, але головний блокер – ризик порушення приватності та втрата довіри аудиторії. Без згоди користувачів, використання цієї технології може призвести до юридичних наслідків.
Ключове слово (keyword) — слово або фраза, яка має особливе значення в певному контексті та використовується для ідентифікації або категоризації інформації.
Для кого це і за яких умов
Для використання потрібен лише смартфон з встановленим додатком Max. Однак, для аналізу даних та розробки нових моделей розпізнавання потрібна команда ML-інженерів та інфраструктура для обробки великих обсягів аудіоданих.
Альтернативи
| VK Max (BC-ResNet) | Google Speech-to-Text | AssemblyAI | |
|---|---|---|---|
| Ціна | Дані не розкриті | $0.004/хв | $0.25/хв |
| Де працює | Android | Хмара | Хмара |
| Мін. вимоги | Смартфон | API | API |
| Ключова різниця | Локальна обробка | Розпізнавання мови | Транскрипція |
💬 Часті запитання
Такий розбір щоранку о 08:00
Персональний AI-дайджест для вашої галузі — щодня у Telegram
Навчіть вашу команду будувати такі AI-автоматизації
За 5 днів кожен співробітник побудує автоматизацію для своєї ділянки роботи.
Дізнатись більше → aiupskill.live