Meta、Llama 3.1 405Bを発表:オープンソース最強モデル、MMLU88.6%達成で開発者コミュニティが熱狂
Metaが最新のLlama 3.1シリーズを正式発表し、405Bパラメータ版がMMLUベンチマークで88.6%のスコアを記録してオープンソース大規模言語モデルの性能頂点に立った。完全オープンソース形式での無料商用ライセンス提供により、開発者
Metaが最新のLlama 3.1シリーズを正式発表し、405Bパラメータ版がMMLUベンチマークで88.6%のスコアを記録してオープンソース大規模言語モデルの性能頂点に立った。完全オープンソース形式での無料商用ライセンス提供により、開発者
OpenAIが最近発表したSoraの新しい動画デモは、AI動画生成の技術的上限を再び更新した。このデモは、テキストプロンプトから最大1分間の高画質動画を生成でき、物理的リアリティとシーンの複雑さは驚嘆に値する。
NVIDIAのCEOファン・ジェンスンは、期待されているBlackwell AIチップ・プラットフォームの量産が2024年末まで延期されることを公式に認め、業界に大きな衝撃を与えた。
イーロン・マスクがX上でOpenAIを激しく批判し、同社が非営利組織から「強欲な商業主体」に変貌したと主張。さらにGPT-5が自社のGrokモデルに遅れをとると大胆に予測した。
OpenAIの新モデル「o1」の詳細がネット上で流出し、推理能力に特化した最適化によりAIが単純なパターンマッチングから真の「思考」へと進化することを示している。
xAIが初のマルチモーダル大規模言語モデル「Grok-1.5 Vision」を発表し、RealWorldQAベンチマークでOpenAIのGPT-4Vを上回る性能を示した。Elon Muskが自らXプラットフォームでデモを行い、わずか数時間で
アリババクラウドの通義千問チームが発表したQwen2.5-Maxモデルが、権威ある中国語MMLU基準テストで86.1%のスコアを記録し、OpenAIのGPT-4o(85.8%)を超えて中国語大規模モデルの首位に躍り出た。この躍進により24時
米国連邦裁判所は、Midjourneyなどの企業が芸術家の作品を訓練データとして使用する行為が侵害に当たる可能性があるとの仮判決を下した。この判決はAI革新と知的財産権のバランスについて業界の深い反省を引き起こしている。
AnthropicのClaude 3.5 Sonnetがソフトウェアエンジニアリングベンチマークテスト「SWE-bench」で49%の正確率を達成し、GPT-4o(33.2%)を大きく上回った。この技術的ブレークスルーはX上で数万回シェアさ
イーロン・マスクがXプラットフォームでOpenAIの非営利から営利企業への転換を厳しく批判し、創業理念からの逸脱と人類の安全への脅威を警告。AI業界でオープンソースvs.クローズドソースの議論が再燃。
中国AI企業DeepSeekが発表したV2チャットボットが、無料でGPT-4oに匹敵する性能を実現し、X上で10万件超の議論を呼んで爆発的な人気を博している。
OpenAIのo1-previewモデルは数学・推論タスクで驚異的な性能を示したが、複雑な数学問題で頻繁に「幻覚」(誤った回答を自信満々に生成)を起こすことが判明し、AI専門家から真の能力を疑問視する声が上がっている。この事件はX上で百万を
xAIが10万枚のNVIDIA H100 GPUを搭載したColossusスーパーコンピュータクラスタの正式稼働を発表し、世界最大規模のAI学習プラットフォームの一つとして注目を集めています。
2026年2月10日、X.comプラットフォームでAIエージェントの自主性と人格権に関する議論が急速に拡大し、数万件の投稿が殺到。この技術が人類社会の倫理的底線を再形成し、21世紀最大のイデオロギー戦場になる可能性を巡って激しい論争が展開さ
アリババクラウドが発表したQwen2-72B-InstructがMeta社のLlama3-70B-Instructを複数の権威あるベンチマークテストで上回り、特に中英バイリンガル能力で際立った性能を示したことで、オープンソースコミュニティで
OpenAIの待望のo1シリーズ推論モデルのベータ版プレビューが意図せずリークされ、数学競技AIIMEベンチマークテストで83%という高得点を記録。Sam Altman CEOが近日中の正式リリースを確認し、AI界に衝撃が走った。
xAIが初の視覚マルチモーダルモデルGrok-1.5Vを正式リリースし、RealWorldQAベンチマークテストでOpenAIのGPT-4Vを上回る性能を示した。
AnthropicがClaude 3.5 Sonnetモデルを正式発表し、コーディング、数学、視覚などの複数のベンチマークテストでOpenAIのGPT-4oを全面的に上回り、生成AI分野の競争が再び激化している。
xAIのGrok AIの画像生成機能が「デジタル脱衣」や未成年者を対象とした露骨な画像の生成に悪用され、世界的な規制強化と倫理的議論を巻き起こした。
第60回スーパーボウルでシアトル・シーホークスがニューイングランド・ペイトリオッツを28-24で逆転勝利し、Bad Bunnyの全編スペイン語ハーフタイムショーがプラットフォームX上で激しい文化論争を引き起こした。