私がGoogleの「Auto Browse」AIエージェントにChromeを任せた結果、期待外れに終わった

編集者注:AIエージェントのブラウザ革命、さらなる改良が必要

AI技術が急速に発展する2026年、GoogleはChromeブラウザを受動的なツールから知能アシスタントに変える「Auto Browse」AIエージェントを発表した。自動ショッピング、旅行計画、チケット購入を約束し、ユーザーの手を解放するとしている。しかし、WIRED記者のReece Rogersによる実地テストレポートは残酷な現実を明らかにした:この機能は革新的だが、まだまだ成熟には程遠い。本稿はWIRED原稿を編集し、業界背景と組み合わせて、AIエージェントのブラウザ分野における潜在力と問題点を分析する。編集者は、マルチモーダルAIモデルの進化に伴い、この分野は爆発的成長を迎えるが、プライバシーと信頼性の問題は無視できないと考える。

Google「Auto Browse」とは何か?

要求を話すだけで、ブラウザが自主的にウェブページをナビゲートし、フォームを記入し、取引を完了する——これがGoogle「Auto Browse」のビジョンだ。このツールはGeminiシリーズの大規模モデルに基づき、Chromeの実験的拡張機能に統合され、2025年末に内部テスト版として発表された。従来の検索とは異なり、Auto Browseは人間のブラウジング行動を模倣できる「AIエージェント」(AI Agent)だ:リンクをクリックし、ページをスクロールし、テキストを入力し、さらには認証コードも処理できる。

業界背景として、AIエージェントはGoogleが初めてではない。早くも2023年には、OpenAIのGPT-4oがブラウザ制御能力を実証し、AnthropicのClaude 3.5は「コンピューター使用」機能で類似の操作を実現した。MicrosoftのCopilotやPerplexityの検索エージェントも後に続いた。これらのツールの核心は「ツール呼び出し」(Tool Calling)と「視覚理解」(Vision)で、AIが画面を「見て」行動を決定できるようにする。GoogleのAuto BrowseはChromeエコシステムにより特化し、90%の市場シェアを活用して、ブラウザ自動化の天下統一を狙っている。

「Auto Browseはあなたのために服を買い、旅行を計画し、チケットを購入できる。少なくとも、それがコンセプトだ。」——原文抜粋

筆者の実体験:ショッピングから旅行まで、困難の連続

Reece Rogersは2026年1月31日のテストで、Auto BrowseにChromeを任せた。まず簡単なタスク:Tシャツを買う。ユーザーは「Amazonで黒いコットンTシャツを買ってください、予算50ドル」と入力。AI起動後、Amazonホームページを開き、製品を検索したが、すぐに行き詰まった——間違ったサイズを選び、Primeメンバー特典を無視した。最終的に、Rogersは手動で介入せざるを得ず、取引は失敗した。

より複雑な旅行計画も同様に失望的だった。指示は「ラスベガスへの週末旅行を計画してください、航空券とホテルを含む」。Auto BrowseはKayakとBooking.comを訪問したが、価格比較時にエラー:日付を誤読し、期限切れのフライトを推奨した;ホテル予約時には、名前の略語を間違えて入力し、セキュリティ検証をトリガーした。著者は、AIは「酔った助手」のようで、クリックは多いが効率が低いと描写している。コンサートチケット購入時には、Ticketmasterで繰り返し更新したが、人気席は買えなかった。

テストデータは衝撃的:10のタスクのうち、成功は3つのみ、平均所要時間は人手の2倍。問題の根源は「幻覚」(Hallucination)と「コンテキスト喪失」にある:AIは時々存在しないボタンを「想像」したり、以前のステップを忘れたりする。Rogersは、ChromeのサンドボックスセキュリティメカニズムもAIの権限を制限し、頻繁な警告ポップアップにつながったと指摘している。

技術分析:AIエージェントのボトルネックと展望

なぜAuto Browseは「機能しなかった」のか?まず、ブラウザ環境の複雑性だ。動的ローディング、A/Bテスト、アンチクローリングメカニズムにより、AIのコンピュータービジョンモデル(Gemini Visionなど)は要素を安定的に識別することが困難だ。次に、長期記憶の欠如:チャットAIとは異なり、エージェントは複数ステップの推論を処理する必要があるが、分岐パスで迷いやすい。

業界知識の補足:2025年、AIエージェント市場の評価額は500億ドルを超えた。AdeptやMultiOnなどのスタートアップは、API統合をサポートする専用ブラウザエージェントをすでに発表している。Googleの優位性はデータにある:Chromeが収集した大量のユーザー行動でモデルをファインチューニングできる。しかし、プライバシー論争も随伴する——EUのGDPR調査が開始され、Auto Browseがブラウジング履歴を盗んでいるかどうかを疑問視している。

編集者の分析:現在のAIエージェントは「幼児期」にある。強化学習(RLHF)を参考に、将来のバージョンはユーザーフィードバックによって自己最適化される可能性がある。2027年、Auto BrowseがEコマースの返品や株式取引をシームレスに処理できるようになれば、それはブラウザ革命となるだろう。しかし短期的には、人間を置き換えるのではなく、補助するのにより適している。

競争状況:Google対ライバル

Googleは孤軍奮闘ではない。SafariのApple Intelligenceエージェントはプライバシーを強調し、EdgeのCopilotはBingのリアルタイムデータを統合している。オープンソースコミュニティのBrowserGPTプロジェクトはカスタムエージェントを許可している。Rogersのテストで言及されているように、Claudeのブラウザツールは精度で20%勝っているが、速度は遅い。

エージェントツール成功率平均時間
Auto Browse30%5分
Claude Computer50%7分
Copilot40%4分

(データは筆者のテストシミュレーションに基づく)

将来展望:「機能しない」から生活を変えるまで

Rogersの結論は「潜在力は大きいが未成熟」だが、Googleは毎月の更新を約束している。Project Astraのマルチモーダル能力と組み合わせることで、Auto Browseは万能の生活アシスタントに進化する可能性がある。ユーザーは慎重になる必要がある:有効化前に権限を確認し、敏感な操作を避ける。

一般ユーザーにとって、これはAIが万能ではないことを思い出させる。短期的には、Google Assistantなどの音声アシスタントと組み合わせる;長期的には、信頼できるエージェントがデジタルライフを再構築することを期待する。

本稿はWIREDから編集、著者Reece Rogers、2026年1月31日。