Лингвоподкаст

Технологии перевода жестовых языков | Лиза Петрова, SberDevices

Как современные технологии делают доступнее мир для слабослышащих людей? 🫰🏻 В новом выпуске подкаста мы встретились с Лизой Петровой — Computer Vision инженером из SberDevices. Лиза и ее команда занимаются задачами, связанными с компьютерным зрением и автоматической обработкой жестовых языков.  

Выпуск получился очень интересным! Мы обсудили:

📍Как собирались и готовились данные для самого большого датасета для распознавания РЖЯ

📍Важно ли разработчикам знать жестовый язык, чтобы делать state-of-the-art модели

📍Как команде удалось создать лучшую в мире модель по распознаванию американского жестового языка

Ведущая, продюсер: Мария Бочарова

Монтажер: Андрей Чиркин

🎧 Подписывайтесь на нас в соц. сетях: 

t.me/lingvo_podcast

vk.com/lingvopodcast

📩 Вопросы и предложения отправляйте на почту: lingvopodcast.hse@gmail.com

Таймкоды:

0:42 Путь Лизы в Data Science и карьера в SberDevice

4:14 Проекты R&D команды SberDevices: HaGRID, Slovo, EasyPortrait. Что такое face parsing, матирование, гармонизация

9:05 Инклюзия. Потребность в распознавании РЖЯ

11:30 Корректные обращения к слабослыщащим

12:46 Датасет Slovo – как он создавался и какие были проблемы

22:12 Изучение РЖЯ раКак современные технологии делают доступнее мир для слабослышащих людей? 🫰🏻

24:45 Лучшая в мире модель по распознаванию американского жестокого языка SignFlow

27:12 Как ML-модели работают с видео

30:48 План развития: непрерывная речь, перевод, контекст

33:43 Первый в мире открытый датасет РЖЯ и аналоги в других стран

35:56 Результаты обучения модели

37:29 Потенциал продукта

39:29 Будущее сурдопереводчиков

40:00 Мотивация работать в индустрии