多模态AI に関するニュース

オリジナル

GPT-5.5正式リリース:100万トークンのコンテキスト+ネイティブコンピュータ操作実現 スーパーアプリの突破とAI権力集中の議論が並行

GPT-5.5が正式にリリースされ、100万トークンのコンテキストウィンドウやネイティブコンピュータ操作能力、多段階チェーンプロンプト(MCP)などの新機能が登場しました。これにより、AIアプリケーションの限界が再構築され、技術的な進歩と倫

GPT-5.5 OpenAI 多模态AI
466
オリジナル

Meta Llama 3.2ビジュアルモデルが重大発表:オープンソースマルチモーダルAIがモバイル時代へ

MetaがLlama 3.2ビジュアルモデルシリーズ(11B・90Bパラメータ版)を発表し、Llamaファミリー初の視覚機能を搭載。軽量11Bモデルはスマートフォンで効率的に動作可能で、オープンソース化後わずか数日でダウンロード記録を更新し

Llama 3.2 视觉模型 オープンソースAI Meta
697
オリジナル

Google Gemini 2.0のマルチモーダルアップグレード:動画理解とエージェント能力が飛躍的向上、ベンチマークテストでSoraを超える

GoogleがGemini 2.0のマルチモーダルアップグレードを重大発表し、動画理解とインテリジェントエージェント能力において飛躍的な進歩を遂げ、ベンチマークテストでOpenAIのSora動画生成モデルを上回ったことで業界の注目を集めてい

Gemini 2.0 多模态AI 视频理解 Google DeepMind
507
オリジナル

Meta Llama 3.2ビジュアルモデルリリース:軽量マルチモーダルAIがスマートフォン時代を開く

Meta AIチームがLlama 3.2シリーズモデルを発表し、Llamaファミリー初のビジョン機能を導入。軽量1B・3Bパラメータ版はスマートフォンでの動作に最適化され、マルチモーダルAIの消費者向けデバイスへの展開における重要な一歩とな

Llama 3.2 Meta AI 视觉模型 多模态AI
670
オリジナル

Moonshot AI Kimi新バージョンリリース:長文コンテキストとマルチモーダル機能が中国語AIブームに火をつける

中国のAIスタートアップMoonshot AIのチャットボットKimiが大幅アップグレードを実施し、超長文コンテキストウィンドウとマルチモーダル機能でネットを席巻。ユーザーからは「国産GPTキラー」との称賛が相次ぎ、中国語大規模言語モデル(

Kimi Moonshot AI 中文LLM 长上下文
1,141