Голосовой клон за 10 секунд: технология, которая убирает "тупые" паузы у ассистентов
За 18 минут обсуждаем:
Вас тоже бесят голосовые ассистенты, которые "думают" целую вечность перед ответом? Новая технология Delay Streams Modeling обещает это исправить, заставляя ИИ слушать и говорить одновременно. Наши ведущие - парень-скептик и девушка-энтузиаст - разбираются, как это работает и почему возможность скопировать ваш голос за 10 секунд - это и прорыв, и угроза.
Что вы узнаете из диалога:
• Главная тема - как работает DSM - технология, которая позволяет ИИ отвечать быстрее, чем вы моргнете
• Неожиданный поворот - всё бесплатно и для всех: почему разработчики выложили эти мощные инструменты в открытый доступ
• Спорный момент - клонирование голоса за 10 секунд: ведущие спорят, чего здесь больше - удобства для создания контента или рисков дипфейков
• Практическая польза - как это изменит голосовых ассистентов, аудиокниги и почему ваш iPhone сможет делать все это без подключения к интернету
• Забавный факт/парадокс - над чем посмеемся: сравнение скорости ответа ИИ со скоростью загрузки сторис при плохом Wi-Fi
Самые интересные моменты обсуждения:
* Разбор двух моделей распознавания: быстрая (0,5 сек) для диалога и точная (2,5 сек) для юридических записей - компромисс между скоростью и качеством
* Скептик: "Пока только английский и французский, нам-то что с этого?" Энтузиаст: "Но раз код открыт, перевод на русский - лишь вопрос времени!"
* Неожиданная аналогия: почему DSM - это переход от модели "послушал, потом отреагировал" к модели "слушаю и одновременно реагирую", как человек
Упомянутые в выпуске:
* Технология Delay Streams Modeling (DSM) от Qai
* Клонирование голоса за 10 секунд
* Открытый исходный код (Open Source) для коммерческого использования
* Будущие проекты: Unmute (голос для любого ИИ), Hibiki (перевод в реальном времени)
* Сравнение с конкурентами (ElevenLabs) и поддержка Apple MLX
🎧 Включайте прямо сейчас!
Всего 18 минут - и вы поймете, на пороге какой революции в общении с технологиями мы стоим.
Слушайте, как наши ведущие спорят, шутят и пытаются представить мир, где любой искусственный интеллект сможет говорить вашим голосом.
💬 Делитесь мнением в комментариях на нашем канале Дзен
https://dzen.ru/id/67b32972c1e9cc7bfefb3174
🔔 Подписывайтесь, чтобы не пропустить новые выпуски
Thông Tin
- Chương trình
- Tần suấtHằng ngày
- Đã xuất bảnlúc 14:05 UTC 20 tháng 9, 2025
- Thời lượng18 phút
- Mùa1
- Tập81
- Xếp hạngSạch