Шёпот, крик и рэп. Что умеют голосовые роботы и как «варятся» голоса (yet another podcast #41)

yet another podcast

Инженеры Яндекса больше десяти лет разрабатывают технологию распознавания и синтеза речи SpeechKit. Она применяется в Алисе, Браузере, Картах и других продуктах Яндекса. Кроме этого, сервисом Yandex SpeechKit на облачной платформе Yandex Cloud пользуются и другие компании. Они, например, озвучивают контент или автоматизируют кол-центры.

👀 Обо всех возможностях SpeechKit для бизнеса: https://clck.ru/3EaxN7 

Недавно Яндекс представил принципы этичной работы над синтезом речи, которые применяет команда SpeechKit при разработке технологии. Например, сервис не синтезирует речь людей без их разрешения и информирует дикторов о том, как именно будут использованы их голоса.

👀 Все принципы синтеза речи: https://clck.ru/3EaxLV  

По этому поводу — выпуск yet another podcast про речевые технологии, которые распознают, анализируют и синтезируют голоса. Как они создаются и на что способны? Заменят ли роботы профессиональных дикторов и какие речевые технологии мошенники используют сегодня? И главное — наступит ли время, когда человек больше не будет говорить по телефону?

На эти и многие другие вопросы отвечают руководитель группы развития речевых технологий Елена Белоброва и руководитель ML-сервисов Yandex Cloud Василий Ершов.

🦸‍♂️ В гостях — Павел Пудан, профессиональный диктор и заместитель председателя Союза дикторов

Щоб прослухати епізоди з відвертим змістом, потрібно ввійти в систему.

Стежте за оновленнями для цього шоу

Увійдіть або зареєструйтеся, щоб стежити за шоу, зберігати епізоди й отримувати найновіші оновлення.

Виберіть країну або регіон

Африка, Близький Схід та Індія

Азіатсько-Тихоокеанський регіон

Європа

Латинська Америка та Кариби

Сполучені Штати Америки та Канада