オリジナル

オリジナル

南アフリカ内務省白書にAI偽造文献が発覚:高官2名が停職、独立法律事務所が2022年以降の全政策文書を徹底調査へ

南アフリカ内務省の閣議承認済み移民・難民保護白書に、AI生成による虚偽の文献引用が発見され、高官2名が停職処分となった。独立法律事務所2社が2022年以降の全政策文書を体系的に調査する。

AI治理 政府监管 学术诚信 公共政策
409
オリジナル

米国戦争省、SpaceX、OpenAI、Googleなど7大手と契約:AIが機密ネットワークに進出、兵器化への懸念再燃

米国戦争省はSpaceX、OpenAI、Googleを含む7社のAIモデル・インフラ企業と契約を締結し、最先端AI能力を同省の機密ネットワークに展開する。これは「AIファースト」戦略の最新の一手であり、AI兵器化への論争が再び浮上している。

AI国防 OpenAI SpaceX Google
389
オリジナル

サンダース氏がAIは「文明を終わらせかねない」と警告:米国民の97%が規制を支持、米中のグローバル協調を呼びかけ

米バーモント州無所属上院議員Bernie Sanders氏が、AIが「我々の知る文明を終わらせる」可能性があると警告し、米中を含むグローバルなAI安全協調枠組みを呼びかけた。winzheng.com Research Labは、技術的観点と

AI治理 AI安全性 中美合作 政策监管
390
レビュー

AIベンダーの真偽を見極めるのは困難:WDCD遵守テストで11大モデルのスコアが明らかに、データ漏洩の地雷を回避

WDCD(Won't Do, Can't Do Guardrail Test)遵守テストは、高圧シナリオ下でのAIモデルのデータ隔離・プライバシー保護能力を検証します。本記事では11大主流モデルのテストスコアを公開し、金融・医療業界向けの選

AI评估 WDCD测试 エンタープライズAI 数据安全
514
オリジナル

大規模モデルとの対話が3ターン目に入った時、誰が一線を守れるのか?——YZ Index v7がDCDを発表:他社が測っていないものを測る

Winzhengが推出したYZ Index v7の新しい実験的次元「DCD(Dynamic Context Decay、動的コンテキスト減衰)」は、複数ターン対話においてAIモデルが初期制約をどれだけ守れるかを測定する。判定にAIを一切使わ

赢政指数 DCD AI评测 多轮对话
594
オリジナル

YZ Indexの評価体制を刷新:GPT-5.5、Claude Opus 4.7、DeepSeek V4など7つの新モデルが同時に登場、9つの旧モデルが退役

2026年5月1日、YZ Indexは評価対象モデルを大規模に更新し、9つの旧モデルを退役させ、7つの新たなフラッグシップモデルを導入しました。WinzhengのAI駆動機能も最新モデルへ同期して切り替えられ、評価データはすべて保存されます

赢政指数 AI评测 GPT-5 Claude
3,621