関連リンク
- AI エージェント用の Chrome DevTools(MCP) Blog Chrome for Developers
Chromeの開発チームは、AIエージェント向けの新しいツール「Model Context Protocol(MCP)サーバー」の公開プレビューを開始しました。これは、AIを活用した開発を大きく変える可能性を秘めています。
これまでAIコーディングアシスタントは、コードを生成できても、それが実際にブラウザでどう動くのかを直接確認するのが苦手でした。例えるなら、目隠しをしてプログラミングしているようなもので、問題の発見や修正が難しかったのです。
この課題を解決するため、Chrome DevTools MCPサーバーが登場しました。MCPとは、大規模言語モデル(LLM)のようなAIを外部のツールやデータに接続するためのオープンな標準プロトコルです。このサーバーは、AIエージェントにChrome DevToolsの強力なデバッグ機能やパフォーマンス分析機能を使えるようにします。これにより、AIがウェブページを直接チェックし、まるで人間のように問題を見つけて修正できるようになります。
AIエージェントがMCPサーバーを使うことで、以下のような様々なことが可能になります。
- コード変更のリアルタイム検証: AIが生成したコードが、ブラウザで期待通りに動作するかを自動で確認できます。
- ネットワークやコンソールエラーの診断: ウェブページで画像が読み込まれない、フォームの送信に失敗するといった問題を、AIがネットワークリクエストやコンソールログを分析して原因を特定します。
- ユーザー行動のシミュレーション: AIが、フォーム入力やボタンクリックなどのユーザーの操作をシミュレートし、複雑なユーザーフローにおけるバグを発見します。
- スタイリングやレイアウト問題のデバッグ: AIがライブのウェブページを検査し、CSSの崩れやレイアウトの乱れといった視覚的な問題を特定し、具体的な修正案を提案します。
- パフォーマンス監査の自動化: ウェブサイトの読み込み速度が遅い場合、AIが自動でパフォーマンスを計測・分析し、改善のための具体的なアドバイスを提供します。
この新しいMCPサーバーは、簡単な設定を加えるだけで、すぐに試すことができます。AIエージェント開発者は、GitHubのドキュメントで詳細な使い方を確認できます。
この機能はまだプレビュー版で、開発チームはAIを活用した次世代の開発ツールをより良くしていくために、ユーザーからのフィードバックを積極的に募集しています。ウェブ開発におけるAIの可能性を広げる、非常にエキサイティングな一歩と言えるでしょう。
引用元: https://developer.chrome.com/blog/chrome-devtools-mcp?hl=ja
- Multi Agentを介した知識の活用の検討 - Preferred Networks Research & Development
Preferred Networks(PFN)が、複数のAIを協力させて知識を最大限に活用する「Multi Agent(マルチエージェント)」という新しい手法の研究成果を発表しました。新人エンジニアの皆さんも、ぜひ知っておきたいAIの最新の活用事例です。
この研究では、AI同士が議論しながら最適な答えを見つける「LLM Debate(エルエルエムディベート)」というMulti Agentの手法を使いました。具体的には、PFNが独自に開発した医療分野に特化したAI「Preferred-MedLLM-Qwen-72B」と、高性能な汎用AIである「GPT-4o」を組み合わせ、医師国家試験の問題を解かせました。
AIを単体で使う場合、それぞれが持つ知識には得意なことと苦手なことがあります。そこで、両方のAIを協調させることで、お互いの得意な知識を補い合い、より正確な答えを導き出すことを目指しました。実験の結果、Preferred-MedLLM-Qwen-72BとGPT-4oを連携させた場合、単体で問題を解くよりも平均で約15点も正解率が向上し、医師国家試験で90%を超える高い正解率を達成しました。
この研究から、特に重要な点が2つ見つかりました。
- 専門知識を持つAIの重要性: ドメイン特化の学習をしていない一般的なAIとGPT-4oを組み合わせた場合は、正解率の向上がほとんど見られませんでした。この結果は、特定の分野の深い知識を持つAI(Preferred-MedLLM-Qwen-72Bのようなモデル)が、他のAIと協力して複雑な問題を解決する上で、非常に重要であることを示しています。専門知識があるからこそ、質の高い議論ができると言えるでしょう。
- AIの汎化性能: Preferred-MedLLM-Qwen-72Bは、単に問題を解くだけでなく、他のAIが出した答えを評価したり、さらに良い答えを考えたりする「回答評価」のような、より複雑なタスクでも高い能力を発揮しました。これは、特定のタスクだけでなく、様々な指示や状況に対応できる「汎化性能」が高いことを示しており、このAIが幅広い用途で活用できる可能性を秘めていることを意味します。
この研究は、強力な汎用AIと、特定の専門分野に特化したAIをうまく組み合わせることで、AIの推論能力をさらに引き出せることを示しています。PFNは、この知見を今後のAI研究開発や、実際の社会課題解決のためのソリューション開発に活かしていく方針です。異なるAIの「得意」を組み合わせて、これまでにない価値を生み出すこの研究は、私たちエンジニアがAIの未来を考える上で、非常に刺激的で希望に満ちた内容だと言えるでしょう。
引用元: https://tech.preferred.jp/ja/blog/medllm-multi-agent/
- 決定論的システムと非決定論的AI Agentの接合点:OSSフレームワークEmbabelが拓く新しいソフトウェア開発の可能性
ログラスが発表した「Loglass AI Agents」構想は、従来のSaaSが扱う「決定論的な」タスク(常に同じ結果が期待される)に加え、「非決定論的な」タスク(毎回結果が変動しうる)もAI Agentで実現し、より良い意思決定を支援することを目指します。
しかし、AIエージェントの活用には大きな課題があります。AIエージェントは高度な能力を持つ一方で、同じ指示を与えても結果が毎回異なる「非決定論的な」振る舞いをすることがあります。これは、会計システムのように「同じ入力には常に同じ出力」が求められる従来の業務アプリケーションの信頼性や一貫性とは相性が悪く、ビジネスでAIエージェントを安心して使う上での大きな障壁です。
この課題を解決するため、Springフレームワーク開発者のRod Johnson氏がOSSのAIエージェントフレームワーク「Embabel」を開発しました。EmbabelはKotlin製で、「生成AIを安全かつ信頼性の高いものにし、ビジネス価値を最大限に引き出す」ことを目的としています。特に、決定論的な要素と非決定論的な要素が混ざった業務の解決に貢献します。
Embabelの主な特徴は二つです。
- GOAPによる決定論的な計画ステップ: 多くのAIエージェントが大規模言語モデル(LLM)に全てを任せるのに対し、Embabelはタスク実行前に「GOAP(Goal Oriented Action Planning)」というLLM非依存のアルゴリズムで行動計画を立てます。これにより、エージェントの動きが予測可能になり、信頼性が求められるタスク(データ検索など)はプログラムで確実に処理し、LLMは創造的なタスク(返答生成など)に集中できます。
- ドメインモデルと型安全性(DICE): AIエージェント開発では、LLMとのやり取りが型のないデータになりがちで堅牢性が低下する問題がありました。Embabelは厳密な型を持つ「ドメインモデル」の利用を推奨します。これを「DICE(Domain-Integrated Context Engineering)」と呼び、既存のビジネス知識をAIの文脈に統合。型安全なデータでLLMが既存システムと連携できるようになり、堅牢な開発が可能になります。
Embabelは、これらの特徴を通じて、企業レベルで信頼性のあるAIエージェントの実現を目指します。AIエージェント開発はまだ黎明期ですが、Embabelのようなフレームワークは、従来のシステムとAIの創造性を融合させ、全く新しい「AIネイティブなプロダクト」を創造する鍵となるでしょう。
引用元: https://zenn.dev/loglass/articles
資訊
- 節目
- 頻率每日更新
- 發佈時間2025年9月28日 下午8:00 [UTC]
- 年齡分級兒少適宜