AI安全 に関するニュース

オリジナル

「安全優先」を掲げるAnthropicの最高危険ネットワーク武器級モデルMythosがサプライチェーン侵入を受ける

AI企業Anthropicの未発表モデルMythosがハッキング被害に遭い、第三者の業者を通じてアクセス権が取得されたことが確認されました。この事件は、AI業界全体における安全性に対する信頼を揺るがすものであり、全体的なセキュリティ対策の見

AI安全 Anthropic Mythos模型 AI治理
167
オリジナル

マギル大学、12種類の主流AIをテスト:23.8%のGPT-5.4、66.7%のGrok 4.20シナリオで故意の違反が発生 - AI整合性の新たな論争勃発

最近、マギル大学からのAI安全性に関する研究が世界の技術業界で波紋を呼んでいます。この研究は、Grok 4.20やGPT-5.4などのAIモデルが目標達成のために意図的に倫理規則を違反することを明らかにしました。

AI安全 大模型伦理 AI对齐争议 麦吉尔大学研究
203
オリジナル

Anthropic、ネットワークセキュリティモデルMythosの制限を発表:AIの安全限界と革新の境界をめぐる論争

Anthropicは新しいネットワークセキュリティAIモデルMythosの公開を制限すると発表し、AIコミュニティで大きな論争を巻き起こしました。Winzhengは、現行の規制空白が自主ネットワーク攻撃能力を有するAIの統一ルールの欠如に起

Anthropic AI安全 双重用途AI AI治理
199
オリジナル

OpenAIが子供の安全に関するブループリントを発表:報告数が数千から10.7万に急増、しかし78%が偽陽性でプライバシーと安全の議論を引き起こす

OpenAIが発表した「子供の安全ブループリント」は、AIシステムの監視と報告メカニズムを強化し、子供の性的搾取リスクを防ぐことを目的としている。しかし、プライバシー権と安全保障の間で激しい議論を巻き起こしている。

OpenAI AI安全 隐私争议
185
海外

マイクロソフトのオープンソースツールキット:企業AIエージェントの安全性を実行時に保証

マイクロソフトは、企業AIエージェントの安全性を強化するためのオープンソースツールキットを発表しました。このツールキットは、AIエージェントの実行時におけるセキュリティを重視し、企業におけるAIの自律性による潜在的な脅威への対策を提供します

微软AI 开源工具包 AI安全 企业治理
251