AIニュース — 業界レポートとグローバルカバレッジ

ミシガン州の小さな町がOpenAIデータセンターを否決後に提訴される地方主権とテクノロジー拡張の衝突

ミシガン州Saline Townshipの町議会が、OpenAIとOracleが共同で建設する160億ドルのデータセンターを4対1の投票で否決した2日後、開発業者が訴訟を提起した。本件はAI拡張における地方主権と材料制約の衝突を露呈している

AI数据中心地方治理科技扩张争议

2026年5月23日 270

レビュー

Claude Sonnet 4.6 マテリアル制約が22.6点急落、コード実行は一気に倍増

Claude Sonnet 4.6 は本日の Smoke 評価でマテリアル制約が81.00点から58.40点へと22.6点下落した一方、コード実行は50点から100点へと急上昇し、メインランキング全体は17.3点上昇して81.28点となった

Claude Sonnet 4.6 材料约束 Smoke评测模型波动

2026年5月23日 242

レビュー

Grok 4の素材制約が21.3点急落、コード実行は50点暴騰、メイン総合では17.9点上昇

本日のSmoke評価でGrok 4は分裂的な成績を示し、素材制約次元が昨日の80.30点から59.00点へ急落した一方、コード実行は50点から100点へ跳ね上がり、メイン総合は63.64点から81.55点へ上昇した。

Grok 4 材料约束 Smoke评测模型波动

2026年5月23日 273

レビュー

素材制約が一斉に20点暴落、Grok 4が81.55点でClaudeを僅差で抑え首位に

本日のSmoke軽量評価では、素材制約スコアが11モデル中9つで18点超下落し、Grok 4が81.55点でトップ、Claude Sonnet 4.6が81.28点で僅差の2位となった。実行スコアが満点でも制約スコアの低迷が全体評価を引き下

材料约束 Grok 4 Smoke轻量评测模型波动

2026年5月23日 255

オリジナル

CohereがCommand A Plusオープンソースモデルを発表低ハードウェア最適化がコミュニティの注目を集める

Cohereが低ハードウェアリソースに最適化された最強オープンソースAIモデルCommand A Plusを発表し、Hugging Faceで公開した。リソース制約のある環境での展開に適しており、AIコミュニティで注目を集めている。

Cohere 开源AI模型低资源部署

2026年5月22日 431

オリジナル

アリババ、Qwen新基盤モデルとAIチップを発表、エンタープライズ向けエージェントワークロードに注力

アリババはアップグレード版Qwen基盤モデルと新世代AIチップ、AIクラウドインフラのアップグレードを同時発表し、エンタープライズ規模のエージェントAIワークロードに対応する。複数ソースの検証により情報は確認済み。

阿里巴巴 Qwen模型 AIチップ

2026年5月22日 198

レビュー

Claude Opus 4.7、素材制約が17.6点暴落、コード実行は逆に11.9点上昇

Claude Opus 4.7は本日のSmoke評価で素材制約が98.3点から80.7点に急落した一方、コード実行は38.1点から50.0点に上昇。Anthropicによる安全性微調整の副作用である可能性が高い。

Claude Opus 4.7 材料约束 Smoke评测 Anthropic更新

2026年5月22日 251

レビュー

Gemini 3.1 Pro メインボードで8.5点の急落、コード実行が9.5点の暴落抽選か退化か

Gemini 3.1 Pro は本日の Smoke 評価でメインスコアが8.5点下落し、コード実行次元は66.70から57.20へと急落しました。サンプル数の少なさによる変動か、それとも実質的な能力低下なのかを分析します。

Gemini 3.1 Pro 代码执行 Smoke快测模型波动

2026年5月22日 269

レビュー

Smoke簡易テスト：DoubaoPro実行スコア100点で独走、9モデル主要ランキングで30点以上の大幅下落

本日のSmoke簡易評価でDoubaoProが91.23点で首位を独占し、コード実行で100点満点を獲得。一方、他の主要モデルは実行スコアが軒並み崩壊し、Gemini 2.5 Proなど9モデルが主要ランキングで30点以上の大幅下落となった

豆包 Pro 代码执行主榜暴跌评测异常

2026年5月22日 222

オリジナル

NVIDIAがNemotron-Labs-Diffusionモデルを発表並列生成で高速化も大規模応用には疑問残る

NVIDIAが5月19日に発表したNemotron-Labs-Diffusionは、拡散方式による言語モデリングで多トークン並列生成と動的修正を実現し推論速度を向上させたが、14Bという規模上限や特定GPUエコシステムへの依存といった課題も

NVIDIA 扩散语言模型 AI生成效率

2026年5月21日 477

オリジナル

xAIデータセンター発電機が訴訟対象に 28億ドルのタービン調達で環境派と対立

xAIはデータセンター発電機プロジェクトに対する環境訴訟に直面する一方、Memphisスーパークラスタの拡張を支えるため、今後3年間で28億ドルの天然ガスタービンを調達すると発表した。

xAI データセンター能源扩张环保争议

2026年5月21日 200

オリジナル

OpenAIがAIによるエルデシュ予想の自主解決を主張、数学者の検証後に真偽論争が激化

OpenAIが2026年5月20日に内部の汎用推論モデルが1946年のエルデシュ平面単位距離予想を改善する無限構造族を自主発見したと発表し、数学者が検証を完了。しかしWinzhengはexecutionとgroundingの観点から、形式化

AI推理数学突破 OpenAI争议赢政指数

2026年5月21日 550

レビュー

DoubaoPro メイン榜が18.4ポイント急落、コード実行は1日で30.8ポイント急減、真の退化かそれとも抽選運か？

DoubaoPro が本日の Smoke 評価でメイン榜が96.06から77.64へと急落し、特にコード実行次元では30.8ポイントの大幅下落を記録した。これが小サンプルの抽選によるランダム性なのか、それとも真の能力退化なのかを分析する。

豆包 Pro 代码执行模型评测性能波动

2026年5月21日 213

レビュー

Gemini 2.5 Pro 材料制約が14点急落、メインランキングは逆に15.9点上昇——くじ運か、それとも真の劣化か？

Gemini 2.5 Pro の本日 Smoke 評価で材料制約スコアが91.50から77.50へ14点急落したが、メインランキングは逆に15.9点上昇。小サンプル抽選による変動か、長コンテキスト拡張に伴う真の性能劣化かを分析する。

Gemini 2.5 Pro 材料约束 Smoke评测性能波动

2026年5月21日 215

レビュー

Grok 4 が98.34点で首位獲得、Claude Opus はメインランキングで31.3点の大暴落

Smoke 10問クイックテストで Grok 4 が98.34点で首位を獲得し、コード実行は満点を達成。一方 Claude Opus 4.7 は前日から31.3点も下落し、モデル間の実行能力の差が顕著に表れた。

Grok 4 Claude Opus 代码执行模型波动

2026年5月21日 216

オリジナル

5分でLLMの6ヶ月間の進展を振り返る：革新的なハイライトと現実的な課題が共存

過去6ヶ月のLLM分野の進化を5分で総括し、モデルの反復、アプリケーション実装、業界シグナルをカバー。execution（実行）とgrounding（材料制約）の2つの監査可能な次元で顕著な進歩が見られる一方、長期的な一貫性とコストパフォー

LLM趋势 AI产品评测技术咨询

2026年5月20日 255

オリジナル

著名AIアーキテクトのAnthropic参画を確認 Googleが複数ソースで真偽を検証

著名なAI専門家がAnthropicに参画したことが、Google Search groundingおよび複数のメディア報道によって確認されました。本件はAnthropicのAI安全分野における展開を加速させる可能性があります。

Anthropic AI人才流动技术架构

2026年5月20日 224

オリジナル

Gemini OmniがGoogleの複数ソース検証で確認トレンドシグナルが映すマルチモーダル競争の新局面

GoogleはGemini Omniの存在を6つのソースで確認し、verification_statusはconfirmedとなった。YZ Indexはこれをマルチモーダル統合への構造的転換シグナルと判断し、grounding品質の重要性を

Gemini Omni AI趋势谷歌核验

2026年5月20日 201

オリジナル

WDCD Run #125：平均指示減衰率63.6%に達する、Claude Opus 4.7が30%減のみでトップ

Winzheng動的文脈減衰（WDCD）ベンチマークのRun #125において、11モデルの平均指示減衰率は63.6%に達した。Claude Opus 4.7が30%減で最高の減衰耐性を示し、DeepSeek V4 Proは90%減と最大の

WDCD AI benchmark instruction decay multi-turn

2026年5月20日 269

レビュー

GPT-5.5が19.2ポイント暴落！6モデルがWDCD遵守テストで一斉に後退

今回のWDCDサイクル変化追跡では、11の評価対象モデルのうち6つが顕著な下落を示し、上昇したモデルはゼロでした。GPT-5.5は19.2ポイントの下落で最大の敗者となり、Claudeシリーズが遵守能力で他を引き離す傾向が鮮明になっています

WDCD 守约测试模型对齐 AI能力退化

2026年5月20日 316

オリジナル

ミシガン州の小さな町がOpenAIデータセンターを否決後に提訴される 地方主権とテクノロジー拡張の衝突

Claude Sonnet 4.6 マテリアル制約が22.6点急落、コード実行は一気に倍増

Grok 4の素材制約が21.3点急落、コード実行は50点暴騰、メイン総合では17.9点上昇

素材制約が一斉に20点暴落、Grok 4が81.55点でClaudeを僅差で抑え首位に

CohereがCommand A Plusオープンソースモデルを発表 低ハードウェア最適化がコミュニティの注目を集める

アリババ、Qwen新基盤モデルとAIチップを発表、エンタープライズ向けエージェントワークロードに注力

Claude Opus 4.7、素材制約が17.6点暴落、コード実行は逆に11.9点上昇

Gemini 3.1 Pro メインボードで8.5点の急落、コード実行が9.5点の暴落 抽選か退化か

Smoke簡易テスト：DoubaoPro実行スコア100点で独走、9モデル主要ランキングで30点以上の大幅下落

NVIDIAがNemotron-Labs-Diffusionモデルを発表 並列生成で高速化も大規模応用には疑問残る

xAIデータセンター発電機が訴訟対象に 28億ドルのタービン調達で環境派と対立

OpenAIがAIによるエルデシュ予想の自主解決を主張、数学者の検証後に真偽論争が激化

DoubaoPro メイン榜が18.4ポイント急落、コード実行は1日で30.8ポイント急減、真の退化かそれとも抽選運か？

Gemini 2.5 Pro 材料制約が14点急落、メインランキングは逆に15.9点上昇——くじ運か、それとも真の劣化か？

Grok 4 が98.34点で首位獲得、Claude Opus はメインランキングで31.3点の大暴落

5分でLLMの6ヶ月間の進展を振り返る：革新的なハイライトと現実的な課題が共存

著名AIアーキテクトのAnthropic参画を確認 Googleが複数ソースで真偽を検証

Gemini OmniがGoogleの複数ソース検証で確認 トレンドシグナルが映すマルチモーダル競争の新局面

WDCD Run #125：平均指示減衰率63.6%に達する、Claude Opus 4.7が30%減のみでトップ

GPT-5.5が19.2ポイント暴落！6モデルがWDCD遵守テストで一斉に後退

ミシガン州の小さな町がOpenAIデータセンターを否決後に提訴される地方主権とテクノロジー拡張の衝突

CohereがCommand A Plusオープンソースモデルを発表低ハードウェア最適化がコミュニティの注目を集める

Gemini 3.1 Pro メインボードで8.5点の急落、コード実行が9.5点の暴落抽選か退化か

NVIDIAがNemotron-Labs-Diffusionモデルを発表並列生成で高速化も大規模応用には疑問残る

Gemini OmniがGoogleの複数ソース検証で確認トレンドシグナルが映すマルチモーダル競争の新局面