おちつきAIラジオ

これ知らないと恥をかく!?AIの学習と参照の違い。今更聞けないRAGをやさしく解説(ep.12)

あなたはAIに「学習させてる」と安易に言っていませんか? もしかしたら、それは「学習」ではなく「参照」させているだけかもしれません。今回は、AI解像度が劇的に上がる「学習」と「参照」の決定的な違いを、AI技術「RAG(ラグ)」の解説を通じてお届けします。RAGとは、AIに外部の知識を与える技術のこと。企業独自のチャットボットなどが、なぜ最新情報や社内情報に答えられるのか?その裏にはRAGがいます。しぶちょー曰く、GPTのメモリ機能なども実はAIがあなたを理解して「学習」したのではなく、毎回「カンペ」を「参照」しているだけ。この違いがわかると、AIの見え方がガラッと変わります。「RAGはオワコン?」という噂の真相から、AIクローン「カネリンRAG」の作り方まで。AIに驚き疲れたあなたにこそ聞いてほしい、衝撃の事実が満載です。

【目次】

(00:00) オープニング&今週のテーマ「今さら聞けない、ラグの話」

(01:01) 2024年に大流行した「RAG」、今はオワコン?

(02:38) RAGはAI理解に超重要!知らないと落ち着けない理由

(04:45) RAGの正体「検索拡張生成」とは?

(06:07) LLMの弱点「最新情報を知らない」をどう補うか

(08:15) RAGは「学習」じゃない!AIにカンペを渡す仕組み

(11:42) 犯罪捜査にも使える?独自データベースとRAGの可能性

(14:00) RAGがオワコンと言われる本当の理由

(15:08) RAGを組むのは難しい?検索技術の裏側

(17:50) キーワード検索 vs ベクトル検索、意味空間の話

(22:14) AI開発の泥臭い作業①:チャンク分けとオーバーラップ

(27:05) AI開発の泥臭い作業②:ハイパーパラメータ調整

(28:50) ゴミを入れたらゴミが出る!データ前処理の重要性

(34:00) RAGの発展系?最近流行りの「グラフRAG」とは

(38:32) AI解像度を見分ける魔法の言葉「学習」

(39:53) あなたのAIは「学習」or「参照」?衝撃の事実

(42:40) GPTのメモリ機能はカンペだった!AIはあなたを理解してない?

(47:00) RAGは「カンペ仕分けマシン」、でもAIも使ってる?

(56:20) RAGとファインチューニングはどう違う?

(58:39) チャットボットの裏にはRAGがいる!

(1:01:11) クローンAI「かねりんRAG」は作れる?

(1:06:27) RAGが消えたもう一つの理由:AIエージェントへの吸収

(1:09:46) まとめ:「学習」と「参照」を意識して落ち着こう

(1:10:41) エンディングトーク

【今回の放送回に関連するリンク】

【今回の要チェックキーワード】

RAG(Retrieval-Augmented Generation):外部の知識データベースから関連情報を検索し、それをもとに生成するAIの手法。

ベクトル検索(Vector Search):テキストなどの意味を数値ベクトルに変換し、「意味の近さ」で類似情報を探す検索方法。

キーワード検索(Keyword Search):単語やフレーズの一致をもとに情報を探す、従来型の検索方法。

ハイブリッド検索(Hybrid Search):ベクトル検索とキーワード検索を組み合わせて、精度と再現性を両立させる検索方法。

グラフベース検索(Graph-Based Search):情報同士の関係をグラフ構造で表し、「つながり」や「関連性」をたどって検索する方法。

チャンク(Chunk):長い文章や文書をAIが扱いやすい単位に分割したデータのかたまり。

埋め込み処理(Embedding):テキストや画像を、意味を保持したまま数値ベクトル(多次元の点)に変換する処理。

検索クエリ(Search Query):検索エンジンやAIに「何を探すか」を指示するための入力文。

ファインチューニング(Fine-Tuning):既存のAIモデルを特定のデータで再学習させ、目的に合わせて精度を高める手法。

—----------------------------

【番組の概要】

日々のAIトピックを、現役のAIエンジニアがやさしく解説する対談番組。AIニュースに驚き疲れたあなたに、おちつきを提供します。AIニュースの、驚くポイント、驚かなくても良いポイントがわかります。

★ご感想やコメントは、番組公式ハッシュタグをつけてX(旧Twitter)でポストしていただけるとありがたいです。

【番組公式ハッシュタグ】

#おちつきAI

【番組公式X】

https://x.com/ochitsuki_AI

【パーソナリティ(MC)】

▼しぶちょー

・AIエンジニア

・技術士(機械部門) 

「大手機械メーカーでAI開発の最前線を担う現役エンジニア。AI(ディープラーニング)の実装スキルを証明する「E資格」を保有。機械(ハードウェア)への高度な知見も有し、双方の専門性を掛け合わせ『AIの社会実装』に貢献する。情報発信活動にも精力的に取り組み、ブログ・音声配信(Podcast/Voicy)・SNSなどで幅広く活躍。単なる技術解説でなく、行動変容を伴う情報発信を信条とする。その姿勢が評価され、2025年UJA科学広報賞 審査員特別賞を受賞。著書に『集まれ設計1年生 はじめての締結設計』(日刊工業新聞社)。岐阜県テクノプラザものづくり支援センター広報大使、生成AI EXPO in 東海 共同代表も務める。」

https://x.com/sibucho_labo

https://voicy.jp/channel/3963

▼かねりん(金田勇太)

・KANERIN Podcast Studios 代表

・一般社団法人 地方WEB3連携協会 理事

「刑事司法実務の最前線で多数の犯罪捜査を指揮。2017年から暗号資産業界へ参入。数々のグローバルプロジェクトに参画しコンサルティング、情報分析・アドバイザリー業務を提供。コンサートライブ配信業、音声配信業、テックメディア創業等を経て、ポッドキャストレーベル兼プロダクション「KANERIN Podcast Studios」を創業。多様なパートナーと共に、未来へつなぐ声の原典を共創している。」

https://x.com/kanerinx

https://voicy.jp/channel/2534

【プロデューサー】

かねりん https://x.com/kanerinx

【サウンド・アーキテクト】

Aviv Haruta https://x.com/oji_pal

【カバーアートデザイン】

UTA https://x.com/uta_dib

【制作/著作】

KANERIN Podcast Studios

--------------------------------------------------

※画像引用元:https://www.hyro.ai/blog/retrieval-augmented-generation-rag-conversational-ai/

【各種ポッドキャストスタンドへのリンク】

Spotify

https://open.spotify.com/show/6iGk39bSta5KZ1QD7jvK2o

Apple Podcast

https://podcasts.apple.com/us/podcast/id1841316430

Amazon Music

https://music.amazon.co.jp/podcasts/aba8e9a4-aefb-404a-b366-4b7a11b3f7cb/

YouTube

https://www.youtube.com/playlist?list=PLNQiF7XIko7QOIlyFMiI_aDdk1eJzNiCD

LISTEN

https://listen.style/p/ochitsukiai