Meta Llama 3.2ビジュアルモデルが重大発表:オープンソースマルチモーダルAIがモバイル時代へ
MetaがLlama 3.2ビジュアルモデルシリーズ(11B・90Bパラメータ版)を発表し、Llamaファミリー初の視覚機能を搭載。軽量11Bモデルはスマートフォンで効率的に動作可能で、オープンソース化後わずか数日でダウンロード記録を更新し
MetaがLlama 3.2ビジュアルモデルシリーズ(11B・90Bパラメータ版)を発表し、Llamaファミリー初の視覚機能を搭載。軽量11Bモデルはスマートフォンで効率的に動作可能で、オープンソース化後わずか数日でダウンロード記録を更新し
GoogleがGemini 2.0のマルチモーダルアップグレードを重大発表し、動画理解とインテリジェントエージェント能力において飛躍的な進歩を遂げ、ベンチマークテストでOpenAIのSora動画生成モデルを上回ったことで業界の注目を集めてい
Googleの次世代大規模モデルGemini 2.0に関する流出情報が話題となっており、特に動画理解性能がOpenAIのSoraモデルを上回るとされている。Google I/O開発者会議の延期と相まって、業界のGoogleAI戦略への期待が
xAIが初のマルチモーダル大規模言語モデル「Grok-1.5 Vision」を発表し、RealWorldQAベンチマークでOpenAIのGPT-4Vを上回る性能を示した。Elon Muskが自らXプラットフォームでデモを行い、わずか数時間で
Meta AIチームがLlama 3.2シリーズモデルを発表し、Llamaファミリー初のビジョン機能を導入。軽量1B・3Bパラメータ版はスマートフォンでの動作に最適化され、マルチモーダルAIの消費者向けデバイスへの展開における重要な一歩とな
Baiduが文心一言4.0 Turbo版を正式リリースし、推論速度を3倍に向上させ、中国語マルチモーダル能力を強化。デモ動画が中国語SNSで急速に拡散し、開発者テストではGPT-4に匹敵する性能と評価された。
Googleが2024年12月に発表したGemini 2.0 Flashは、低遅延と高効率を実現した軽量マルチモーダルAIモデルで、リリース以来10万回以上のベンチマークテストを記録し、開発者コミュニティで大きな注目を集めています。
中国のAIスタートアップMoonshot AIのチャットボットKimiが大幅アップグレードを実施し、超長文コンテキストウィンドウとマルチモーダル機能でネットを席巻。ユーザーからは「国産GPTキラー」との称賛が相次ぎ、中国語大規模言語モデル(
2023年8月13日、xAIはGrok-2とGrok-2 miniを正式に発表しました。これらの新しいAIモデルは、画像理解やリアルタイムのXプラットフォームデータ処理で優れた性能を示し、Elon Muskが自らデモを行ったことで注目を集め