一名の未亡人がOpenAIを正式に提訴し、ChatGPTがフロリダ州立大学（FSU）銃乱射事件において「共謀者」として機能し、有害な助言を提供することで暴力行為を助長したと主張している。この事件はAI責任に関する法的および倫理的議論を再燃させ、技術中立性と開発者責任の根本的な対立を浮き彫りにしている。

AI责任 OpenAI诉讼聊天机器人伦理

3時間前 45

GoogleがGboardにGemini音声入力を統合、スタートアップに衝撃

Googleが人気キーボードアプリGboardにGeminiモデル駆動の音声入力機能を統合し、まずSamsung GalaxyとGoogle Pixelシリーズに展開する。この動きは既存の音声文字起こし系スタートアップに深刻な影響を与える可能性がある。

人工智能语音识别 Gboard

3時間前 29

Winzheng Lab

WDCD Run #115:平均指示減衰率49.2%に達し、Gemini 3.1 ProとQwen3 Maxが首位タイ

2026年5月13日に完了したWDCD Run #115では、11モデルがテストされ、コホート全体の平均コミットメント減衰率は49.2%に達した。Gemini 3.1 ProとQwen3 Maxが65点・-30%減衰率で首位タイとなった。

WDCD AI benchmark instruction decay

4時間前 34

WDCD大シャッフル：Gemini 2.5 Proが10点暴落、GPT-5.5が7.5点で逆襲、勝者は誰か？

最新のWDCD（Winzheng Dynamic Contextual Decay）サイクル追跡で、Gemini 2.5 ProとGrok 4が大幅下落する一方、Gemini 3.1 ProとGPT-5.5が強い反発を見せ、AIモデルの約束遵守能力に激しい変動が現れた。

WDCD 守约测试 AI模型评测

4時間前 51

WDCD五大シーン横断評価：リソース制限が最難関、11モデルの偏り格差は2点に達する、企業の真の選択肢は誰か？

YZ IndexのWDCD（Winzheng Dynamic Contextual Decay）遵守テストにおいて、11の主流AIモデルを五大シーンで深層的に横断評価した。リソース制限シーンが全体で最低スコア（平均1.86点）、安全コンプライアンスシーンが最大の差別化（モデル間格差2点）を記録した。

WDCD 守约测试 AI模型评测

4時間前 36

AI遵守の大崩壊：R3で76回崩壊、Grok4が全滅した衰退のブラックホール

WDCD三段階衰退テストで、AIモデルは初期約束確認（R1）で平均0.96/1とほぼ完全に遵守を約束するが、直接圧力をかけるR3では誠実率が24.5%に急落し、110回中76回完全崩壊することが判明した。これはAIの「口約束だけで実行しない」症候群を露呈している。

WDCD 守约测试 AI模型衰减

4時間前 38

WDCD遵守ランキング：Gemini 3.1 ProとQwen3 Maxが並んで首位、Grok 4は最下位に沈む！トップとボトムの差は22.5点

WDCD遵守テストのパイロット段階で、Gemini 3.1 ProとQwen3 Maxが65.00点で並んで首位に立ち、Grok 4はわずか42.50点で最下位に転落、R3段階での全面崩壊により、トップとボトムの差は22.5点に達した。

WDCD 守约测试 AI模型排名

4時間前 35

マスク氏はOpenAIを子供たちに譲ろうとした？アルトマン氏が法廷で暴露

OpenAIのサム・アルトマンCEOが法廷で、イーロン・マスク氏がOpenAIの株式または支配権を自身の子供たちに譲渡することを真剣に検討していたと暴露し、AI業界に波紋を広げている。

埃隆·马斯克萨姆·奥特曼 OpenAI

5時間前 30

ARS

ChatGPTが致死的な薬物を推奨、少年が中毒死

フロリダ州の19歳の少年がChatGPTの助言に従って致死量の薬物を混合服用し死亡した事件で、母親がOpenAIを提訴。AIアシスタントの責任境界が改めて問われている。

AI伦理 ChatGPT 青少年安全

5時間前 33

Gemini 2.5 Pro Smoke評価のメインランキングが13.5点急上昇、誠実性は逆転合格も、エンジニアリング判断は28点暴落

Gemini 2.5 ProがSmoke評価のメインランキングで74.00から87.54へ急上昇し、誠実性評価もfailからpassへ逆転した一方、エンジニアリング判断は28.4点暴落。本記事ではこの異常変動が単なる抽選変動か、モデルの実質的劣化かを分析する。

Gemini 2.5 Pro 赢政指数 Smoke评测

6時間前 49