マイクロソフト、新たに3つの基礎モデルを発表しAI競争に挑む
マイクロソフトは、OpenAIやGoogle、Anthropicといった競争相手に対抗するため、3つの新しい基礎モデルを発表しました。これにより、生成AI市場での存在感を一層強化しようとしています。
マイクロソフトは、OpenAIやGoogle、Anthropicといった競争相手に対抗するため、3つの新しい基礎モデルを発表しました。これにより、生成AI市場での存在感を一層強化しようとしています。
GoogleがGemini 3.1 Flash Liveを発表し、その革命的な対話型音声AIモデルがGoogle検索、Geminiアプリ、開発者ツールで正式にリリースされた。稲妻のような応答速度と高度にリアルな音声合成能力により、ユーザーは
マルチモーダルAIが金融業界の複雑な文書処理を自動化し、従来のOCRシステムの限界を克服して効率を大幅に向上させている。
MetaがLlama 3.2ビジュアルモデルシリーズ(11B・90Bパラメータ版)を発表し、Llamaファミリー初の視覚機能を搭載。軽量11Bモデルはスマートフォンで効率的に動作可能で、オープンソース化後わずか数日でダウンロード記録を更新し
GoogleがGemini 2.0のマルチモーダルアップグレードを重大発表し、動画理解とインテリジェントエージェント能力において飛躍的な進歩を遂げ、ベンチマークテストでOpenAIのSora動画生成モデルを上回ったことで業界の注目を集めてい
AnthropicがClaude Codeに音声モード機能を追加し、自然な音声対話によるプログラミングを実現。AIプログラミング分野での競争力を大幅に強化した。
Googleの次世代大規模モデルGemini 2.0に関する流出情報が話題となっており、特に動画理解性能がOpenAIのSoraモデルを上回るとされている。Google I/O開発者会議の延期と相まって、業界のGoogleAI戦略への期待が
Googleは2026年2月20日、複雑な問題解決に特化した最新AIモデル「Gemini 3.1 Pro」を発表し、長鎖推論や多モーダル統合において驚異的な性能を示した。
Googleは旗艦AIアプリGeminiに音楽生成機能を追加し、テキスト、画像、動画を入力として高品質な音楽を生成できるようになった。この革新により、AI音楽創作がより身近で直感的な時代へと進化している。
インドのAIラボSarvamが30億・105億パラメータのLLMを含む新モデル群を発表し、オープンソースAIの可能性に大きく賭けた。これらのモデルは12以上のインド言語に対応し、多言語・多文化環境に最適化されている。
xAIが初のマルチモーダル大規模言語モデル「Grok-1.5 Vision」を発表し、RealWorldQAベンチマークでOpenAIのGPT-4Vを上回る性能を示した。Elon Muskが自らXプラットフォームでデモを行い、わずか数時間で
Meta AIチームがLlama 3.2シリーズモデルを発表し、Llamaファミリー初のビジョン機能を導入。軽量1B・3Bパラメータ版はスマートフォンでの動作に最適化され、マルチモーダルAIの消費者向けデバイスへの展開における重要な一歩とな
Baiduが文心一言4.0 Turbo版を正式リリースし、推論速度を3倍に向上させ、中国語マルチモーダル能力を強化。デモ動画が中国語SNSで急速に拡散し、開発者テストではGPT-4に匹敵する性能と評価された。
Googleが2024年12月に発表したGemini 2.0 Flashは、低遅延と高効率を実現した軽量マルチモーダルAIモデルで、リリース以来10万回以上のベンチマークテストを記録し、開発者コミュニティで大きな注目を集めています。
中国のAIスタートアップMoonshot AIのチャットボットKimiが大幅アップグレードを実施し、超長文コンテキストウィンドウとマルチモーダル機能でネットを席巻。ユーザーからは「国産GPTキラー」との称賛が相次ぎ、中国語大規模言語モデル(
2023年8月13日、xAIはGrok-2とGrok-2 miniを正式に発表しました。これらの新しいAIモデルは、画像理解やリアルタイムのXプラットフォームデータ処理で優れた性能を示し、Elon Muskが自らデモを行ったことで注目を集め