Google Gemini 3.5 Flash:チャットボットではなく、AIエージェントに賭ける

2026年のGoogle I/O開発者会議において、Googleはこれまでで最も強力なプログラミング兼エージェント型AIモデル「Gemini 3.5 Flash」を正式に発表した。このモデルは複雑な指示を理解できるだけでなく、多段階のタスクを自律的に実行し、さらにはゼロから完全なソフトウェアアプリケーションを構築することも可能だ。Googleのこの動きは明確なシグナルを発している――AIの次の波は、より賢いチャットボットではなく、独立して行動できるエージェント(agent)にあるということだ。

チャットから行動へ:Gemini 3.5 Flashの破壊的能力

従来の大規模言語モデルとは異なり、Gemini 3.5 Flashは設計当初から「自律実行」を中核目標としていた。「株価動向を追跡し、プッシュ通知を統合したiOSアプリを開発する」といった曖昧でオープンエンドなタスク記述を受け取り、自らステップを計画し、ツールを呼び出し、コードを書き、デバッグして展開することができる。GoogleのCEOであるサンダー・ピチャイ氏は、会議で同モデルがわずか数分でリアルタイムデータAPI呼び出しと動的UIデザインを含む完全な天気アプリを作成するデモを披露した。

「我々は『答えを提供する』から『タスクを完了する』へと移行しつつある。」――Google AI部門責任者ジェフ・ディーン氏が基調講演で述べた。

Gemini 3.5 Flashはコーディング能力で顕著な躍進を遂げた。Googleが公表したベンチマークによれば、SWE-bench(ソフトウェアエンジニアリングベンチマーク)における性能は前世代のGemini 2.0 Proより40%向上し、HumanEvalでの合格率も過去最高の92.3%に達した。さらに重要なのは、継続的な学習と適応能力を備えていることだ:タスク実行中にエラーや未知の状況に遭遇した際、モデルは自律的にドキュメントを検索し、エラーログを読み取り、戦略を調整でき、人間の介入を必要としない。

エージェントアーキテクチャ:「対話型」思考の限界を超えて

長年にわたり、主流のAI製品(ChatGPT、Bardなど)は対話型インタラクションに重点を置いてきた:ユーザーが質問を入力し、モデルが回答する。しかしGoogleは、真の生産性向上は、モデルが人間のアシスタントのように能動的に計画し実行できる点から生まれると考えている。Gemini 3.5 Flashは「計画-実行-検証」(Plan-Execute-Verify)のエージェントループアーキテクチャを採用し、内部にはコードインタプリタ、ブラウザツール、API呼び出しインターフェース、ファイルシステム操作機能が統合されている。

このアーキテクチャの重要な革新は「タスク分解」モジュールにある。複雑な指示を受け取ると、モデルはそれを独立して検証可能なサブタスクに分割し、各サブタスクにリソースと実行順序を割り当てる。例えば、ECサイトを構築するタスクは以下のように分解される:データベース構造の設計→バックエンドAPIの作成→フロントエンドコンポーネントの開発→決済ゲートウェイの統合→エンドツーエンドテストの実施。各サブタスクが完了するごとに、モデルは自動的に結果を検証し、問題が見つかった場合はロールバックまたは再実行する。

業界背景:なぜ「エージェント」が新たな競争の焦点になったのか?

Googleの今回の発表は単独の出来事ではない。2025年以降、Microsoft、OpenAI、Anthropicなどの企業はいずれもエージェント能力をモデルアップグレードの中核方向としてきた。OpenAIは2025年末に「Operator」モードを発表し、ユーザーの監督下でChatGPTがブラウザ操作を実行できるようにした。MicrosoftはCopilotをPower Automateワークフローを呼び出せる自動化プラットフォームに拡張した。しかしGoogleのGemini 3.5 Flashは、完全に自律的に完全なソフトウェアを構築すると謳う初の商用モデルであり、AIが「補助ツール」から「開発者の代替」へと大きく踏み出したことを示している。

加えてGoogleは、一連の関連ツールも発表した:新しいVertex AI Agent Builderは企業がエージェントフローをビジュアルに編成することを可能にし、Firebaseとの統合によってモデルが直接バックエンドサービスを呼び出せるようになり、セキュリティ向けの「サンドボックス実行環境」はモデルが機密システムリソースにアクセスできないことを保証する。これらの措置は、エージェントの暴走に対する企業の懸念を軽減することを目的としている。

編集者注:リスクと論争――AIが開発者になるとき

Gemini 3.5 Flashは驚異的な能力を示したが、この進展は業界で広範な議論を引き起こした。第一に、自律的なコーディング能力の向上は、初級プログラマーの職に打撃を与える可能性がある。Google自身の研究では、2028年までに通常のコーディングタスクの40%がAIによって自動完成されると推定されており、これにより賃金の二極化を引き起こす可能性がある――上級アーキテクトの需要が高まる一方、基礎的なコード作成職は減少する。第二に、モデルの自律操作がもたらすセキュリティリスクも無視できない:エージェントが悪意ある誘導によって攻撃的なコマンドを実行したり、作成されたコードに未発見の脆弱性が含まれている場合、深刻な結果を招く可能性がある。Googleはモデルレベルで「倫理チェックポイント」を導入すると表明したが、具体的な効果は検証が待たれる。

より深いレベルで見ると、Googleがチャットボットではなくエージェントに賭けることは、製品哲学の転換を反映している:AIは人間の質問に受動的に応答するだけではなく、能動的に問題を解決する「デジタル従業員」となるべきだ。このビジョンは刺激的だが、人類がAIとの協働の境界線を再考する必要があることも意味する。Gemini 3.5 Flashは「新たなソフトウェアエンジニアリング時代」の起点となるのか?答えはおそらく今後1年以内に明らかになるだろう。

本記事はTechCrunchから編訳したものである