22 min

ep49 (ICASSP): Looking Enhances Listening: Recovering Missing Speech Using Images Leading NLP Ninja

    • Teknologi

ICASSP 2020より,ビジュアル情報を利用し,マスクされた音声信号を復元できるマルチモーダルASRを解説しました.

今回紹介した記事はこちらのissueで解説しています. https://github.com/jojonki/arXivNotes/issues/384

サポーターも募集中です. https://www.patreon.com/jojonki


---

Support this podcast: https://podcasters.spotify.com/pod/show/lnlp-ninja/support

ICASSP 2020より,ビジュアル情報を利用し,マスクされた音声信号を復元できるマルチモーダルASRを解説しました.

今回紹介した記事はこちらのissueで解説しています. https://github.com/jojonki/arXivNotes/issues/384

サポーターも募集中です. https://www.patreon.com/jojonki


---

Support this podcast: https://podcasters.spotify.com/pod/show/lnlp-ninja/support

22 min

Mest populära poddar inom Teknologi

SvD Tech brief
Svenska Dagbladet
Lex Fridman Podcast
Lex Fridman
AI Sweden Podcast
AI Sweden
Search Engine
PJ Vogt, Audacy, Jigsaw
All-In with Chamath, Jason, Sacks & Friedberg
All-In Podcast, LLC
Acquired
Ben Gilbert and David Rosenthal