編集者注:AIエージェントのブラウザ革命、さらなる改良が必要
AI技術が急速に発展する2026年、GoogleはChromeブラウザを受動的なツールから知能アシスタントに変える「Auto Browse」AIエージェントを発表した。自動ショッピング、旅行計画、チケット購入を約束し、ユーザーの手を解放するとしている。しかし、WIRED記者のReece Rogersによる実地テストレポートは残酷な現実を明らかにした:この機能は革新的だが、まだまだ成熟には程遠い。本稿はWIRED原稿を編集し、業界背景と組み合わせて、AIエージェントのブラウザ分野における潜在力と問題点を分析する。編集者は、マルチモーダルAIモデルの進化に伴い、この分野は爆発的成長を迎えるが、プライバシーと信頼性の問題は無視できないと考える。
Google「Auto Browse」とは何か?
要求を話すだけで、ブラウザが自主的にウェブページをナビゲートし、フォームを記入し、取引を完了する——これがGoogle「Auto Browse」のビジョンだ。このツールはGeminiシリーズの大規模モデルに基づき、Chromeの実験的拡張機能に統合され、2025年末に内部テスト版として発表された。従来の検索とは異なり、Auto Browseは人間のブラウジング行動を模倣できる「AIエージェント」(AI Agent)だ:リンクをクリックし、ページをスクロールし、テキストを入力し、さらには認証コードも処理できる。
業界背景として、AIエージェントはGoogleが初めてではない。早くも2023年には、OpenAIのGPT-4oがブラウザ制御能力を実証し、AnthropicのClaude 3.5は「コンピューター使用」機能で類似の操作を実現した。MicrosoftのCopilotやPerplexityの検索エージェントも後に続いた。これらのツールの核心は「ツール呼び出し」(Tool Calling)と「視覚理解」(Vision)で、AIが画面を「見て」行動を決定できるようにする。GoogleのAuto BrowseはChromeエコシステムにより特化し、90%の市場シェアを活用して、ブラウザ自動化の天下統一を狙っている。
「Auto Browseはあなたのために服を買い、旅行を計画し、チケットを購入できる。少なくとも、それがコンセプトだ。」——原文抜粋
筆者の実体験:ショッピングから旅行まで、困難の連続
Reece Rogersは2026年1月31日のテストで、Auto BrowseにChromeを任せた。まず簡単なタスク:Tシャツを買う。ユーザーは「Amazonで黒いコットンTシャツを買ってください、予算50ドル」と入力。AI起動後、Amazonホームページを開き、製品を検索したが、すぐに行き詰まった——間違ったサイズを選び、Primeメンバー特典を無視した。最終的に、Rogersは手動で介入せざるを得ず、取引は失敗した。
より複雑な旅行計画も同様に失望的だった。指示は「ラスベガスへの週末旅行を計画してください、航空券とホテルを含む」。Auto BrowseはKayakとBooking.comを訪問したが、価格比較時にエラー:日付を誤読し、期限切れのフライトを推奨した;ホテル予約時には、名前の略語を間違えて入力し、セキュリティ検証をトリガーした。著者は、AIは「酔った助手」のようで、クリックは多いが効率が低いと描写している。コンサートチケット購入時には、Ticketmasterで繰り返し更新したが、人気席は買えなかった。
テストデータは衝撃的:10のタスクのうち、成功は3つのみ、平均所要時間は人手の2倍。問題の根源は「幻覚」(Hallucination)と「コンテキスト喪失」にある:AIは時々存在しないボタンを「想像」したり、以前のステップを忘れたりする。Rogersは、ChromeのサンドボックスセキュリティメカニズムもAIの権限を制限し、頻繁な警告ポップアップにつながったと指摘している。
技術分析:AIエージェントのボトルネックと展望
なぜAuto Browseは「機能しなかった」のか?まず、ブラウザ環境の複雑性だ。動的ローディング、A/Bテスト、アンチクローリングメカニズムにより、AIのコンピュータービジョンモデル(Gemini Visionなど)は要素を安定的に識別することが困難だ。次に、長期記憶の欠如:チャットAIとは異なり、エージェントは複数ステップの推論を処理する必要があるが、分岐パスで迷いやすい。
業界知識の補足:2025年、AIエージェント市場の評価額は500億ドルを超えた。AdeptやMultiOnなどのスタートアップは、API統合をサポートする専用ブラウザエージェントをすでに発表している。Googleの優位性はデータにある:Chromeが収集した大量のユーザー行動でモデルをファインチューニングできる。しかし、プライバシー論争も随伴する——EUのGDPR調査が開始され、Auto Browseがブラウジング履歴を盗んでいるかどうかを疑問視している。
編集者の分析:現在のAIエージェントは「幼児期」にある。強化学習(RLHF)を参考に、将来のバージョンはユーザーフィードバックによって自己最適化される可能性がある。2027年、Auto BrowseがEコマースの返品や株式取引をシームレスに処理できるようになれば、それはブラウザ革命となるだろう。しかし短期的には、人間を置き換えるのではなく、補助するのにより適している。
競争状況:Google対ライバル
Googleは孤軍奮闘ではない。SafariのApple Intelligenceエージェントはプライバシーを強調し、EdgeのCopilotはBingのリアルタイムデータを統合している。オープンソースコミュニティのBrowserGPTプロジェクトはカスタムエージェントを許可している。Rogersのテストで言及されているように、Claudeのブラウザツールは精度で20%勝っているが、速度は遅い。
| エージェントツール | 成功率 | 平均時間 |
|---|---|---|
| Auto Browse | 30% | 5分 |
| Claude Computer | 50% | 7分 |
| Copilot | 40% | 4分 |
(データは筆者のテストシミュレーションに基づく)
将来展望:「機能しない」から生活を変えるまで
Rogersの結論は「潜在力は大きいが未成熟」だが、Googleは毎月の更新を約束している。Project Astraのマルチモーダル能力と組み合わせることで、Auto Browseは万能の生活アシスタントに進化する可能性がある。ユーザーは慎重になる必要がある:有効化前に権限を確認し、敏感な操作を避ける。
一般ユーザーにとって、これはAIが万能ではないことを思い出させる。短期的には、Google Assistantなどの音声アシスタントと組み合わせる;長期的には、信頼できるエージェントがデジタルライフを再構築することを期待する。
本稿はWIREDから編集、著者Reece Rogers、2026年1月31日。
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接