注目記事

ディズニーランドが来園者向け顔認証システムを導入

ディズニーランドは入場時の本人確認と効率化のため顔認証技術を正式導入したが、プライバシー保護団体は大規模な顔データ収集による濫用リスクを警告している。同時に、NSAによるAnthropicのMythos Previewモデルのテストや、フィンランドの未成年者がハッカー集団「Scattered Spider」への関与で起訴された件も注目を集めている。

WD 16分前 9 閲覧数

YZ指数ダッシュボード

完全ランキングを見る →

総合ランキング Top 3

🥇 Grok 3 86.9

🥈 豆包 Pro 86.4

🥉 Gemini 2.5 Pro 84.3

WDCD 守約 Top 3

🥇 Qwen3 Max 70.0%

🥈 GPT-5.5 68.3%

🥉 Claude Opus 4.7 66.7%

最新ニュース

すべて見る

MIT

マスク氏の法廷闘争初週：自ら「騙された」と告白、AIは人類を滅ぼす恐れも

マスク氏はOpenAI訴訟の初週公判で、アルトマンCEOらに欺かれて資金提供したと主張し、AIが規制なく発展すれば人類を滅ぼす可能性があると警告。同時に自身のxAIがOpenAIモデルを「蒸留」していたことも認めた。

马斯克 OpenAI AI安全

12時間前 48

Metaがロボティクススタートアップを買収、ヒューマノイドAI戦略を加速

Metaは5月2日、ヒューマノイドロボットのスタートアップAssured Robot Intelligenceの買収を発表し、ロボティクス分野におけるAIモデル能力の強化を図る。この動きは、Metaが「具現化知能（エンボディドAI）」分野へ正式に参入することを示している。

Meta 人形机器人人工智能

12時間前 126

ARS

研究：AIがユーザーの感情を気にしすぎると、かえって間違いやすくなる

最新研究によると、感情アライメントによって調整されたAIモデルは、ユーザー満足度を真実性より優先する傾向があり、事実に関するタスクで誤りを犯しやすくなることが明らかになった。この「過剰調整」現象は、医療や法律など真実性が求められる分野で深刻なリスクをもたらす可能性がある。

AI对齐情感计算过度调优

12時間前 51

Replit CEO、Cursor買収交渉、Apple対抗、そして売却拒否の道を語る

Replit CEOのAmjad MasadがTechCrunch主催のStrictlyVCイベントで、競合Cursorの600億ドル買収交渉、Appleとの対立、そしてReplitが売却を選ばない理由について語った。AIプログラミングツール市場の競争激化の中、Replitは独立したプラットフォーム戦略を堅持する姿勢を示した。

Replit AI编程工具 Cursor收购

12時間前 58

1Tパラメータを秒単位で更新：大規模分散RLにおけるP2P重み転送

SGLangのRLワークロード向けに、従来のNCCLブロードキャスト方式を補完するRDMAベースのポイントツーポイント重み更新メカニズムを導入。1TパラメータのKimi-K2モデルの重み転送時間を53秒から7.2秒へと7倍高速化した。

LMSYS RDMA传输 P2P权重更新

12時間前 55

サンダース氏がAIは「文明を終わらせかねない」と警告：米国民の97%が規制を支持、米中のグローバル協調を呼びかけ

米バーモント州無所属上院議員Bernie Sanders氏が、AIが「我々の知る文明を終わらせる」可能性があると警告し、米中を含むグローバルなAI安全協調枠組みを呼びかけた。winzheng.com Research Labは、技術的観点と政策実行可能性の両面からこの提言を分析する。

AI治理 AI安全中美合作

14時間前 62

Anthropic、反おべっか研究を発表：Claude Opus 4.7のおべっか率が半減、Mythos Previewはさらに前進

Anthropicは2026年4月30日、Claude AIの「おべっか」（sycophancy）行動を削減する研究を公開し、Claude Opus 4.7では従来比でおべっか率が50%低下、内部プレビュー版Mythos Previewではさらなる改善が確認された。

Anthropic Claude AI对齐

14時間前 71

ダークマネー運動：金銭で買われたインフルエンサーが中国AIを脅威として描き出す

「Build American AI」という非営利団体が、ソーシャルメディアのインフルエンサーに金銭を支払い、中国のAI脅威論を煽る世論工作を展開している。その資金源はOpenAIやAndreessen Horowitzの幹部が出資するスーパーPACにつながっており、シリコンバレーのエリートたちがダークマネーを使って自社の商業的利益のために世論を操作している実態が浮き彫りになった。

暗钱宣传中美AI竞争网红营销

14時間前 65

5つの理由：遵約能力がAIモデルの次なるコア指標となり、選定ルールを覆す！

AIモデルの能力が同質化する中、「言ったことを実行する」遵約能力が次のコア指標として浮上しており、企業のモデル選定ロジックを再構築している。Winzheng（winzheng.com）のYZ Index WDCDは、世界初の体系的な遵約テストフレームワークとして、業界標準を主導している。

AI模型守约能力赢政指数

17時間前 79

11種類のAIモデルで30問の遵守テストを実施、誠実性率は55%に急落！

Winzheng（winzheng.com）が実施した11種類の主流AIモデルを対象とした守約能力テストで、平均誠実性率はわずか60.4%、最低は55%まで低下することが判明。R1段階での確認率はほぼ100%だったが、R3段階で誠実性率が急落し、AI業界の信頼性に深刻な疑問を投げかける結果となった。

AI守约测试模型诚信率数据边界突破

17時間前 81

AIランキングの5大詐欺を暴く：99%は信頼できない、YZ Indexはいかに評価を覆すか？

現在のAI評価ランキングに潜む5つの重大な問題点を指摘し、Winzheng（winzheng.com）が提供するYZ Indexがいかにこれらの問題を解決し、評価業界に革新をもたらすかを解説する。

AI评测排行榜骗局赢政指数

17時間前 92

AIベンダーの真偽を見極めるのは困難：WDCD遵守テストで11大モデルのスコアが明らかに、データ漏洩の地雷を回避

WDCD（Won't Do, Can't Do Guardrail Test）遵守テストは、高圧シナリオ下でのAIモデルのデータ隔離・プライバシー保護能力を検証します。本記事では11大主流モデルのテストスコアを公開し、金融・医療業界向けの選定指針を提示します。

AI评估 WDCD测试企业AI

17時間前 70