Шёпот, крик и рэп. Что умеют голосовые роботы и как «варятся» голоса (yet another podcast #41)

yet another podcast

Инженеры Яндекса больше десяти лет разрабатывают технологию распознавания и синтеза речи SpeechKit. Она применяется в Алисе, Браузере, Картах и других продуктах Яндекса. Кроме этого, сервисом Yandex SpeechKit на облачной платформе Yandex Cloud пользуются и другие компании. Они, например, озвучивают контент или автоматизируют кол-центры.

👀 Обо всех возможностях SpeechKit для бизнеса: https://clck.ru/3EaxN7 

Недавно Яндекс представил принципы этичной работы над синтезом речи, которые применяет команда SpeechKit при разработке технологии. Например, сервис не синтезирует речь людей без их разрешения и информирует дикторов о том, как именно будут использованы их голоса.

👀 Все принципы синтеза речи: https://clck.ru/3EaxLV  

По этому поводу — выпуск yet another podcast про речевые технологии, которые распознают, анализируют и синтезируют голоса. Как они создаются и на что способны? Заменят ли роботы профессиональных дикторов и какие речевые технологии мошенники используют сегодня? И главное — наступит ли время, когда человек больше не будет говорить по телефону?

На эти и многие другие вопросы отвечают руководитель группы развития речевых технологий Елена Белоброва и руководитель ML-сервисов Yandex Cloud Василий Ершов.

🦸‍♂️ В гостях — Павел Пудан, профессиональный диктор и заместитель председателя Союза дикторов

To listen to explicit episodes, sign in.

Stay up to date with this show

Sign in or sign up to follow shows, save episodes, and get the latest updates.

Select a country or region

Africa, Middle East, and India

Asia Pacific

Europe

Latin America and the Caribbean

The United States and Canada