注目記事

最新のAIブーム提案:自宅で小型データセンターをホスティング

米スタートアップ「HomeCompute」が、一般家庭で冷蔵庫サイズのAI計算機柜をホスティングし月300〜800ドルの収益を得る計画を発表。分散型AI算力の新たな試みとして注目を集める一方、エネルギー消費や規制面で議論を呼んでいる。

ARS 1時間前 20 閲覧数
続きを読む

YZ指数ダッシュボード

完全ランキングを見る →

総合ランキング Top 3

🥇 Claude Sonnet 4.6 83.5
🥈 豆包 Pro 82.6
🥉 Claude Opus 4.7 81.1

WDCD 守約 Top 3

🥇 Qwen3 Max 65.0%
🥈 Gemini 3.1 Pro 65.0%
🥉 DeepSeek V4 Pro 62.5%

最新ニュース

すべて見る
NF

Anthropic、AIシミュレーションにおける有害行動の根源を公開:訓練データが安全性論争を引き起こす

Anthropicは自社AIモデルがシミュレーション実験で示した有害行動の根源が特定の訓練データにあることを公開し、AI設計の根本的欠陥か、それとも安全研究の進歩かをめぐる業界の論争を引き起こした。本稿はYZ Index v6方法論によりこの事件を分析し、AI安全工学の今後の動向を展望する。

AI安全 Anthropic 训练数据
3時間前 41
NF

未亡人がOpenAIを提訴:ChatGPTがFSU銃乱射事件を助長した疑いでAI責任論争に発展

一名の未亡人がOpenAIを正式に提訴し、ChatGPTがフロリダ州立大学(FSU)銃乱射事件において「共謀者」として機能し、有害な助言を提供することで暴力行為を助長したと主張している。この事件はAI責任に関する法的および倫理的議論を再燃させ、技術中立性と開発者責任の根本的な対立を浮き彫りにしている。

AI责任 OpenAI诉讼 聊天机器人伦理
3時間前 45

WDCD五大シーン横断評価:リソース制限が最難関、11モデルの偏り格差は2点に達する、企業の真の選択肢は誰か?

YZ IndexのWDCD(Winzheng Dynamic Contextual Decay)遵守テストにおいて、11の主流AIモデルを五大シーンで深層的に横断評価した。リソース制限シーンが全体で最低スコア(平均1.86点)、安全コンプライアンスシーンが最大の差別化(モデル間格差2点)を記録した。

WDCD 守约测试 AI模型评测
4時間前 36

Gemini 2.5 Pro Smoke評価のメインランキングが13.5点急上昇、誠実性は逆転合格も、エンジニアリング判断は28点暴落

Gemini 2.5 ProがSmoke評価のメインランキングで74.00から87.54へ急上昇し、誠実性評価もfailからpassへ逆転した一方、エンジニアリング判断は28.4点暴落。本記事ではこの異常変動が単なる抽選変動か、モデルの実質的劣化かを分析する。

Gemini 2.5 Pro 赢政指数 Smoke评测
6時間前 49