DoorDashの新AIチャットボット:テキストと写真で料理を注文可能に
米国のフードデリバリー大手DoorDashが新たなAIチャットボット「Ask DoorDash」を発表。ユーザーは自然言語のテキストや写真のアップロードで料理や日用品を検索・注文できるようになった。
米国のフードデリバリー大手DoorDashが新たなAIチャットボット「Ask DoorDash」を発表。ユーザーは自然言語のテキストや写真のアップロードで料理や日用品を検索・注文できるようになった。
明日開催されるGoogle I/Oでは、基盤モデル競争で第3位に甘んじるGoogleがGemini 2.0などの新発表で巻き返しを図る見込みだ。本記事では、Googleが直面するAI焦慮と反撃の可能性を分析する。
エンコーダーは人工知能の理解の鍵であり、その進化はシンプルな統計モデルから始まり、マルチモーダルAIの誕生によって飛躍的に進化してきました。
マイクロソフトは、OpenAIやGoogle、Anthropicといった競争相手に対抗するため、3つの新しい基礎モデルを発表しました。これにより、生成AI市場での存在感を一層強化しようとしています。
GoogleがGemini 3.1 Flash Liveを発表し、その革命的な対話型音声AIモデルがGoogle検索、Geminiアプリ、開発者ツールで正式にリリースされた。稲妻のような応答速度と高度にリアルな音声合成能力により、ユーザーは
マルチモーダルAIが金融業界の複雑な文書処理を自動化し、従来のOCRシステムの限界を克服して効率を大幅に向上させている。
AnthropicがClaude Codeに音声モード機能を追加し、自然な音声対話によるプログラミングを実現。AIプログラミング分野での競争力を大幅に強化した。
Googleは2026年2月20日、複雑な問題解決に特化した最新AIモデル「Gemini 3.1 Pro」を発表し、長鎖推論や多モーダル統合において驚異的な性能を示した。
Googleは旗艦AIアプリGeminiに音楽生成機能を追加し、テキスト、画像、動画を入力として高品質な音楽を生成できるようになった。この革新により、AI音楽創作がより身近で直感的な時代へと進化している。
インドのAIラボSarvamが30億・105億パラメータのLLMを含む新モデル群を発表し、オープンソースAIの可能性に大きく賭けた。これらのモデルは12以上のインド言語に対応し、多言語・多文化環境に最適化されている。