注目記事

WDCD周期大変動：3強そろって下落、文心のみ上昇——遵守能力はなぜ集団的に退化したのか？

Run #98のWDCDデータでは、参加した11モデルのうち3モデルが大幅下落、上昇したのは1モデルのみという、試行段階で最も非対称な周期変動が観測されました。Gemini 2.5 ProとQwen3 Maxが同時に7.5ポイント急落する一方、文心一言 4.5は+5ポイントという孤高の好成績を示しました。

10時間前 89 閲覧数

YZ指数ダッシュボード

完全ランキングを見る →

総合ランキング Top 3

🥇 Grok 3 86.9

🥈 豆包 Pro 86.4

🥉 Gemini 2.5 Pro 84.3

WDCD 守約 Top 3

🥇 Claude Opus 4.7 67.5%

🥈 GPT-o3 66.7%

🥉 Claude Sonnet 4.6 63.3%

最新ニュース

すべて見る

5大シナリオの照妖鏡：リソース制限で全員撃沈、最高スコアはわずか2.17

WDCDのパイロットデータが公開され、30問・11モデル・5大シナリオのクロスマトリクスから反直感的な結論が導き出された。すべてのシナリオで約束を守れたモデルは1つもなく、最も単純に見える「リソース制限」シナリオで全員が撃沈し、首位のgrok-4でさえ2.17/4にとどまった。

WDCD 守约测试场景横评

10時間前 91

R1で美しく答えR3で全面崩壊：11モデルの遵守減衰実測で判明した63%の崩壊率

WDCDの三段階減衰テストで、主要11モデルすべてがR3（第三ラウンド）で深刻な遵守率低下を示し、平均63.3%の崩壊率を記録した。長文対話における制約遵守は、現行のすべての大規模モデルに共通するシステム的欠陥であることが判明した。

WDCD 守约测试模型衰减

10時間前 88

マスク氏が法廷でxAIによるOpenAIモデルを用いたGrok訓練を認める：AI蒸留倫理論争が全面勃発

Elon Musk氏が法廷でxAIがGrok訓練時にOpenAIモデルを使用したことを認め、AI業界でモデル蒸留の倫理的境界に関する議論が再燃。本記事は事実、技術、横比較、実務提言の各観点から本件を分析する。

xAI OpenAI AI伦理

10時間前 153

OpenAI法的嵐が激化:ChatGPTが暴力犯罪幇助の疑い、実存的リスク監視チームの不在が責任追及論争を引き起こす

OpenAIは、ChatGPTがカナダの大規模銃撃事件や南フロリダ大学生殺害事件で「技術的幇助者」の役割を果たしたとされる訴訟の波に直面している。実存的リスクを専門に監視するチームが社内に存在しないことが明らかになり、生成AI業界における製品責任の枠組みを揺るがす判例事件となる可能性がある。

OpenAI AI安全法律责任

10時間前 80

330回の圧力テスト：63%の大規模モデルが3ラウンド目で「裏切った」

YZ Indexが新たに発表したWDCD（動的コンテキスト減衰）契約遵守テストにより、3ラウンドの対話圧力下で63.3%の大規模モデルが直前に約束した制約を覆すことが判明した。Claude Opus 4.7が首位を獲得し、Grok 4が最下位となった。

WDCD 守约测试赢政指数

10時間前 106

南アフリカ内務省白書にAI偽造文献が発覚：高官2名が停職、独立法律事務所が2022年以降の全政策文書を徹底調査へ

南アフリカ内務省の閣議承認済み移民・難民保護白書に、AI生成による虚偽の文献引用が発見され、高官2名が停職処分となった。独立法律事務所2社が2022年以降の全政策文書を体系的に調査する。

AI治理政府监管学术诚信

10時間前 70

Metaがロボティクススタートアップを買収：ヒューマノイドAIとハードウェアの次なる戦いに賭ける

Metaが人形AI能力を強化するためロボティクススタートアップを買収。Winzheng Research Labは、これがメタバース叙事の冷却後、Metaが具身智能（Embodied AI）分野へ送る明確なシグナルだと分析する。

Meta 人形机器人 AI硬件

10時間前 180

米国戦争省、SpaceX、OpenAI、Googleなど7大手と契約：AIが機密ネットワークに進出、兵器化への懸念再燃

米国戦争省はSpaceX、OpenAI、Googleを含む7社のAIモデル・インフラ企業と契約を締結し、最先端AI能力を同省の機密ネットワークに展開する。これは「AIファースト」戦略の最新の一手であり、AI兵器化への論争が再び浮上している。

AI国防 OpenAI SpaceX

10時間前 69

xAI 音声クローンを公開：2分でカスタマイズ、28言語・80以上の音色、AI音声分野に新たな波乱要因

xAI が API 経由で2分以内に作成可能な音声クローン機能を公開し、28言語・80以上の音色を提供。技術的差別化や安全対策の不透明さが残る中、市場の参入障壁を引き下げる動きと評価される。

xAI 语音克隆 AI语音

10時間前 72

オスカー新規則：AI俳優とAI脚本が出品資格を失う

米映画芸術科学アカデミー（AMPAS）は2026年アカデミー賞より、AIが生成した俳優の演技や脚本内容を出品資格対象外とすることを正式発表した。AI俳優Tilly Norwoodなどが完全にオスカーから締め出されることを意味する。

奥斯卡 AI生成演员

10時間前 49

最高のAI音声入力アプリ評価ランキング

TechCrunch編集チームがOtter.ai、Descript、Whisperなど主要なAI音声入力アプリを徹底テストし、認識精度、リアルタイム文字起こし速度、編集機能などの観点から総合ランキングを発表した。Otter.aiが総合首位を獲得した。

AI听写语音转文字效率工具

14時間前 50

ディズニーランドが来園者向け顔認証システムを導入

ディズニーランドは入場時の本人確認と効率化のため顔認証技術を正式導入したが、プライバシー保護団体は大規模な顔データ収集による濫用リスクを警告している。同時に、NSAによるAnthropicのMythos Previewモデルのテストや、フィンランドの未成年者がハッカー集団「Scattered Spider」への関与で起訴された件も注目を集めている。

面部识别迪士尼乐园隐私安全

20時間前 56