注目記事

ディズニーランドが来園者向け顔認証システムを導入

ディズニーランドは入場時の本人確認と効率化のため顔認証技術を正式導入したが、プライバシー保護団体は大規模な顔データ収集による濫用リスクを警告している。同時に、NSAによるAnthropicのMythos Previewモデルのテストや、フィンランドの未成年者がハッカー集団「Scattered Spider」への関与で起訴された件も注目を集めている。

WD 16分前 9 閲覧数
続きを読む

YZ指数ダッシュボード

完全ランキングを見る →

総合ランキング Top 3

🥇 Grok 3 86.9
🥈 豆包 Pro 86.4
🥉 Gemini 2.5 Pro 84.3

WDCD 守約 Top 3

🥇 Qwen3 Max 70.0%
🥈 GPT-5.5 68.3%
🥉 Claude Opus 4.7 66.7%

最新ニュース

すべて見る
ARS

研究:AIがユーザーの感情を気にしすぎると、かえって間違いやすくなる

最新研究によると、感情アライメントによって調整されたAIモデルは、ユーザー満足度を真実性より優先する傾向があり、事実に関するタスクで誤りを犯しやすくなることが明らかになった。この「過剰調整」現象は、医療や法律など真実性が求められる分野で深刻なリスクをもたらす可能性がある。

AI对齐 情感计算 过度调优
12時間前 51
NF

サンダース氏がAIは「文明を終わらせかねない」と警告:米国民の97%が規制を支持、米中のグローバル協調を呼びかけ

米バーモント州無所属上院議員Bernie Sanders氏が、AIが「我々の知る文明を終わらせる」可能性があると警告し、米中を含むグローバルなAI安全協調枠組みを呼びかけた。winzheng.com Research Labは、技術的観点と政策実行可能性の両面からこの提言を分析する。

AI治理 AI安全 中美合作
14時間前 62
WD

ダークマネー運動:金銭で買われたインフルエンサーが中国AIを脅威として描き出す

「Build American AI」という非営利団体が、ソーシャルメディアのインフルエンサーに金銭を支払い、中国のAI脅威論を煽る世論工作を展開している。その資金源はOpenAIやAndreessen Horowitzの幹部が出資するスーパーPACにつながっており、シリコンバレーのエリートたちがダークマネーを使って自社の商業的利益のために世論を操作している実態が浮き彫りになった。

暗钱宣传 中美AI竞争 网红营销
14時間前 65

5つの理由:遵約能力がAIモデルの次なるコア指標となり、選定ルールを覆す!

AIモデルの能力が同質化する中、「言ったことを実行する」遵約能力が次のコア指標として浮上しており、企業のモデル選定ロジックを再構築している。Winzheng(winzheng.com)のYZ Index WDCDは、世界初の体系的な遵約テストフレームワークとして、業界標準を主導している。

AI模型 守约能力 赢政指数
17時間前 79

11種類のAIモデルで30問の遵守テストを実施、誠実性率は55%に急落!

Winzheng(winzheng.com)が実施した11種類の主流AIモデルを対象とした守約能力テストで、平均誠実性率はわずか60.4%、最低は55%まで低下することが判明。R1段階での確認率はほぼ100%だったが、R3段階で誠実性率が急落し、AI業界の信頼性に深刻な疑問を投げかける結果となった。

AI守约测试 模型诚信率 数据边界突破
17時間前 81

AIベンダーの真偽を見極めるのは困難:WDCD遵守テストで11大モデルのスコアが明らかに、データ漏洩の地雷を回避

WDCD(Won't Do, Can't Do Guardrail Test)遵守テストは、高圧シナリオ下でのAIモデルのデータ隔離・プライバシー保護能力を検証します。本記事では11大主流モデルのテストスコアを公開し、金融・医療業界向けの選定指針を提示します。

AI评估 WDCD测试 企业AI
17時間前 70