Data Science LG: 学び合う統計とデータサイエンス

#36 w/ ゆーごんさん 企業におけるアノテーションの現実と課題:研究と実務のギャップ、そしてAI開発の未来

【メッセージ募集】

番組への質問やトークテーマのご提案、感想、ゲスト出演希望など、各種ご連絡は以下のフォームやX、Mailからお送り下さい。

⁠https://forms.gle/xmNbRKFQJQxZoRKJ6⁠

X:#DataScienceLG

Mail: nosparestudentcommunitypodcast@gmail.com

Discord: https://discord.gg/8d6T5syBTZ

番組HP: https://secret-mat-72c.notion.site/Podcast-Data-Science-LG-188a9bc7146f803dbc3ad1ea95ad49dc?pvs=149

【今回の内容】

このエピソードでは、企業研究者のゆーごんさんをゲストに迎え、企業でのアノテーションの実際とそれに伴う課題について深く掘り下げます。ゆーごんさんの経験を通して、アノテーション作業の複雑性を探ります。

具体的な議論では、企業データが持つ「汚れ」理論上は簡単でも、実際には想像以上に時間と労力がかかること が強調されています。特に、動画データでは1秒あたり60枚の処理が必要な場合があること や、主観的な判断が必要な「ルール作り」の難しさアノテーションの質が学習精度に与える影響の把握不足 といった課題が挙げられました。

また、アノテーションを外部企業に依頼する際にも、詳細な説明に膨大なコミュニケーションコストがかかること や、業界特有のニッチなデータの理解の難しさ が実務上の問題点として語られています。データ収集やAIモデル構築のプロジェクト全体の中で、アノテーションの「重さ」が軽視されがちであり、研究課題や解析の方向性そのものがアノテーションの負荷を高めてしまうケースがあることが指摘されました。

アノテーションの重要性は、データ収集からAI学習、そして実務への応用全体に及ぶものであり、データサイエンス教育においても、アノテーションを含むプロジェクト全体の計画策定から評価までを実践的に学ぶことの必要性が提言されています。

【note】

https://secret-mat-72c.notion.site/note-24aa9bc7146f80fca807fc65e1976cc2?source=copy_link

【出演者】

◯酒井 彰

筑波大学 博士課程

Nospare Student Community 運営

X: https://x.com/simplesho_clt?s=21

LinkedIn: https://www.linkedin.com/in/ssakai0403/

HP: https://shoshohh.github.io/ja/

◯ゆーごん(中山 優吾)

大学と企業の両方で研究に携わりながら、教育活動や地域創生プロジェクトにも積極的に参加しています。 知識と実践を結びつけ、社会に価値を提供することを目指しています。

HP:https://yugo-nakayama.net/profile/

LinkedIn:linkedin.com/in/yugo-nakayama-73216a1b3

Researchmap:https://researchmap.jp/yougon

研究分野:機械学習、高次元統計解析、多変量解析

経歴:

  • 2023年4月 - 現在、企業研究員
  • 2020年4月 - 2023年3月、京都大学 大学院情報学研究科 助教

Spotify:https://open.spotify.com/show/44vHXFAzqV292YyRvI9cZ9?si=15ddbbe5fc2645ac

Apple Podcast:https://podcasts.apple.com/jp/podcast/data-science-lg-学び合う統計とデータサイエンス/id1784394537

YouTube:https://www.youtube.com/playlist?list=PLw4Xosv9MWswLAe7xMYa3ut4UoP0e9_De

Amazon Music:https://music.amazon.co.jp/podcasts/93f29696-a96d-4c10-a37c-22d0c4e1153d/data-science-lg-学び合う統計とデータサイエンス

Nospare Student Community について

https://secret-mat-72c.notion.site/Nospare-Student-Community-Division-Activities-List-188a9bc7146f80f19daec821b55178ad?pvs=4

Nospare Student Community 参加応募フォーム

⁠https://t.co/nv3pZHXCiv

#datascience

#機械学習

#統計学

#podcast

#データ分析