31 min.

ep72 ポッドキャストツール「LISTEN」の有料版を使い始めてみて、改めて音声と文字の関係を考えてみ‪た‬ XCrossing

    • Technologie

専用ツールより性能が高いので、LISTEN有料版を文字起こしツールとして使ってみている話から、文字と音声とリアルで得られる情報の違いなどを話しました

00:54 ポッドキャストサービス「LISTEN」を有料版で使用中

02:15 B2B向けの会議音声文字起こしサービスよりもLISTENのほうが良いクオリティ

03:04 利用ユーザーからフィードバックを得て猛烈な勢いでクオリティが良くなっているB2Cサービスのいい例

04:30 文字起こし自体の精度向上、話者分離、Whisperの使いこなし

07:51 日本語と英語が混ざった話になっても、英単語として文字起こしされている

08:31 文字起こしの冒頭に「今回の話題は●●です、文字起こしには以下の登録済み単語を優先してください」

09:40 文字起こしする段階でメタデータをしっかり入れておくことで精度を高めているのでは

11:05 話されていることの内容と理屈が通っていつつ、抽象的で一般化できそうな見出しがついている

13:11 目で見る・目で読むものと、耳で聞くという使い分け

17:27 音で情報を取得するほうが人間にとっては自然で負担が少ないらしい

20:09 言語の習得は音から入るほうがいいよという研究結果

22:40 顧客インタビューでは、言いよどんだり、スピード速くなったりするときはそこに何が意味がある

27:16 コミュニティとして広がるポテンシャルを持つ「LISTEN」

28:22 mixi 20周年:"人がいないからいい

エピソード内で取り上げた情報へのリンク:

* ポッドキャストサービス「LISTEN」 [https://listen.style/]
* LISTEN開発者 近藤さんをゲストにお迎えして語り合った回(ep37) [https://x-crossing.com/ep37.html]
* 「audiobook.jp」で実現する「聴く文化」の創造!学習にも娯楽にも活用できるオーディオブックとは [https://sogyotecho.jp/otobank-ueda-interview/]
* 多言語の習得は「音」から 脳領域特定、文法理解早く [https://www.nikkei.com/article/DGXZQOUF251YP0V20C24A2000000/]
* 約7割の人は「目」より「耳」からのインプットが得意 企業の人材育成における、学習手段の「格差」の問題点 [https://logmi.jp/business/articles/329236]

テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。

及川卓也  @takoratta [https://twitter.com/takoratta]
プロダクトマネジメントとプロダクト開発組織づくりの専門家
自己紹介エピソード ep1 [https://x-crossing.com/ep1.html], ep2 [https://x-crossing.com/ep2.html]

関信浩  @NobuhiroSeki [https://twitter.com/NobuhiroSeki]
アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋
自己紹介エピソード ep52 [https://x-crossing.com/ep52.html]

上野美香  @mikamika59 [https://twitter.com/mikamika59]
マーケティング・プロダクトマネジメントを手掛けるフリーランス
自己紹介エピソード ep53 [https://x-crossing.com/ep53.html]

@x_crossing_ [https://twitter.com/x_crossing_]

https://x-crossing.com [https://x-crossing.com/]

専用ツールより性能が高いので、LISTEN有料版を文字起こしツールとして使ってみている話から、文字と音声とリアルで得られる情報の違いなどを話しました

00:54 ポッドキャストサービス「LISTEN」を有料版で使用中

02:15 B2B向けの会議音声文字起こしサービスよりもLISTENのほうが良いクオリティ

03:04 利用ユーザーからフィードバックを得て猛烈な勢いでクオリティが良くなっているB2Cサービスのいい例

04:30 文字起こし自体の精度向上、話者分離、Whisperの使いこなし

07:51 日本語と英語が混ざった話になっても、英単語として文字起こしされている

08:31 文字起こしの冒頭に「今回の話題は●●です、文字起こしには以下の登録済み単語を優先してください」

09:40 文字起こしする段階でメタデータをしっかり入れておくことで精度を高めているのでは

11:05 話されていることの内容と理屈が通っていつつ、抽象的で一般化できそうな見出しがついている

13:11 目で見る・目で読むものと、耳で聞くという使い分け

17:27 音で情報を取得するほうが人間にとっては自然で負担が少ないらしい

20:09 言語の習得は音から入るほうがいいよという研究結果

22:40 顧客インタビューでは、言いよどんだり、スピード速くなったりするときはそこに何が意味がある

27:16 コミュニティとして広がるポテンシャルを持つ「LISTEN」

28:22 mixi 20周年:"人がいないからいい

エピソード内で取り上げた情報へのリンク:

* ポッドキャストサービス「LISTEN」 [https://listen.style/]
* LISTEN開発者 近藤さんをゲストにお迎えして語り合った回(ep37) [https://x-crossing.com/ep37.html]
* 「audiobook.jp」で実現する「聴く文化」の創造!学習にも娯楽にも活用できるオーディオブックとは [https://sogyotecho.jp/otobank-ueda-interview/]
* 多言語の習得は「音」から 脳領域特定、文法理解早く [https://www.nikkei.com/article/DGXZQOUF251YP0V20C24A2000000/]
* 約7割の人は「目」より「耳」からのインプットが得意 企業の人材育成における、学習手段の「格差」の問題点 [https://logmi.jp/business/articles/329236]

テック業界で働く3人が、テクノロジーとクリエイティブに関するトピックを、視点を行き交わしながら語り合います。

及川卓也  @takoratta [https://twitter.com/takoratta]
プロダクトマネジメントとプロダクト開発組織づくりの専門家
自己紹介エピソード ep1 [https://x-crossing.com/ep1.html], ep2 [https://x-crossing.com/ep2.html]

関信浩  @NobuhiroSeki [https://twitter.com/NobuhiroSeki]
アメリカ・ニューヨークでスタートアップ投資を行う、何でも屋
自己紹介エピソード ep52 [https://x-crossing.com/ep52.html]

上野美香  @mikamika59 [https://twitter.com/mikamika59]
マーケティング・プロダクトマネジメントを手掛けるフリーランス
自己紹介エピソード ep53 [https://x-crossing.com/ep53.html]

@x_crossing_ [https://twitter.com/x_crossing_]

https://x-crossing.com [https://x-crossing.com/]

31 min.

Top-podcasts in Technologie

Acquired
Ben Gilbert and David Rosenthal
✨Poki - Podcast over Kunstmatige Intelligentie AI
Alexander Klöpping & Wietse Hage
Bright Podcast
Bright B.V.
De Technoloog | BNR
BNR Nieuwsradio
Lex Fridman Podcast
Lex Fridman
Tweakers Podcast
Tweakers