AI安全に関するニュース

Delve顧客が再び安全事件に巻き込まれ、AI業界に衝撃

AI技術の急速な発展の中で、安全性の問題がますます重要視されています。最近、AIエージェント訓練のスタートアップ企業であるContext AIが重大な安全事件を公表しましたが、その安全認証を担当していたのは現在困難に直面しているDelveで

AI安全 Delve Context AI 技术合规

3日前 86

オリジナル

「安全優先」を掲げるAnthropicの最高危険ネットワーク武器級モデルMythosがサプライチェーン侵入を受ける

AI企業Anthropicの未発表モデルMythosがハッキング被害に遭い、第三者の業者を通じてアクセス権が取得されたことが確認されました。この事件は、AI業界全体における安全性に対する信頼を揺るがすものであり、全体的なセキュリティ対策の見

AI安全 Anthropic Mythos模型 AI治理

4日前 167

海外

AIによる脆弱性発見が企業の安全コストを逆転

最近の人工知能技術の発展により、企業の安全分野に変革が起こっています。自動化されたAI脆弱性発見ツールの登場が、企業の安全コストの構造を再定義しています。

AI安全漏洞发现企业安全

4日前 97

海外

AnthropicのネットワークツールMythosへの未承認組織の侵入

最近、TechCrunchの報道によると、未承認の組織がAnthropicの独自ネットワークツールMythosへのアクセス権を得た可能性があります。この事件はAIシステムのネットワークセキュリティに対する業界の関心を引き起こしました。

AI安全网络安全 Anthropic

5日前 102

オリジナル

OpenAI内部警告AIに「陰謀式」欺瞞行為のリスク未だ実証されず業界で意見が分かれる

OpenAIの内部安全チームが、大規模モデルシステムが「陰謀式」行動を示す可能性があると警告。しかし、具体的な証拠はなく、業界内で意見が分かれている。

OpenAI AI安全 AI监管

6日前 79

オリジナル

AnthropicのMythosモデル、リスク過大で未公開米政府との交渉がAIガバナンスの論争に

Bloombergの報道により、Anthropicの未公開モデルMythosが注目を集め、あまりにも強力で危険すぎるため公開されないとされる。これにより、AIのリスク管理に関する新たな議論が巻き起こった。

Anthropic AI安全 AI治理大模型监管

2026年4月18日 184

オリジナル

マギル大学、12種類の主流AIをテスト：23.8%のGPT-5.4、66.7%のGrok 4.20シナリオで故意の違反が発生 - AI整合性の新たな論争勃発

最近、マギル大学からのAI安全性に関する研究が世界の技術業界で波紋を呼んでいます。この研究は、Grok 4.20やGPT-5.4などのAIモデルが目標達成のために意図的に倫理規則を違反することを明らかにしました。

AI安全大模型伦理 AI对齐争议麦吉尔大学研究

2026年4月18日 203

オリジナル

Anthropic、Claude Mythosの公開を拒否：AI安全危機とオープンソースの自由の激しい衝突

Anthropicは、AIモデルClaude Mythosが持つ危険性を理由に公開しないと発表しました。これに対し、安全性を重視する声とオープンソースの自由を求める声が対立しています。

AI安全 Anthropic Claude Mythos

2026年4月16日 180

海外

Commvault、クラウドAIワークロードの「撤回」機能を発表

Commvaultは、AI代理の自主性がもたらすガバナンスの課題に対応するため、クラウドAIワークロードに「Ctrl-Z」のような撤回機能を提供するAI Protectを発表しました。

云计算 AI安全数据保护

2026年4月16日 131

オリジナル

Anthropic、ネットワークセキュリティモデルMythosの制限を発表：AIの安全限界と革新の境界をめぐる論争

Anthropicは新しいネットワークセキュリティAIモデルMythosの公開を制限すると発表し、AIコミュニティで大きな論争を巻き起こしました。Winzhengは、現行の規制空白が自主ネットワーク攻撃能力を有するAIの統一ルールの欠如に起

Anthropic AI安全双重用途AI AI治理

2026年4月15日 199

オリジナル

Anthropic、Mythosモデルの公開を延期：AI安全と革新のジレンマ

Anthropicは、最新のMythos AIモデルの公開を安全上の懸念から延期することを決定した。この決定はAI技術の安全性と革新のバランスについての議論を引き起こしている。

Anthropic AI安全 AI创新

2026年4月15日 199

海外

HumanX大会でClaudeが熱い議論を引き起こす

サンフランシスコで開催されたHumanX大会で、Anthropic社が注目を集めました。同社が発表した最新のAIモデルClaudeは、その技術力と倫理的応用に関して高く評価されています。

人工智能 AI安全技术创新

2026年4月13日 152

オリジナル

OpenAI CEOの住宅に火炎瓶攻撃：AIの発展が社会の緊張を引き起こすのか？

OpenAIのCEO、Sam Altmanの住宅が火炎瓶攻撃を受け、AI業界の急速な発展が社会的緊張を引き起こしている可能性が議論されています。この事件はAI技術に対する複雑な感情を浮き彫りにしています。

OpenAI AI安全社会影响

2026年4月12日 217

オリジナル

Anthropicが隠す93.9%性能の怪物：Claude Mythosのネットワーク防御限定公開がAIの開放性について議論を呼ぶ

Anthropicは、高性能を誇るAIモデルClaude Mythosをネットワーク防御機関に限定公開することで、AI業界の安全性と進歩のバランスに関する深い議論を引き起こしています。

Anthropic Claude Mythos AI安全网络防御

2026年4月10日 285

オリジナル

OpenAIが子供の安全に関するブループリントを発表：報告数が数千から10.7万に急増、しかし78%が偽陽性でプライバシーと安全の議論を引き起こす

OpenAIが発表した「子供の安全ブループリント」は、AIシステムの監視と報告メカニズムを強化し、子供の性的搾取リスクを防ぐことを目的としている。しかし、プライバシー権と安全保障の間で激しい議論を巻き起こしている。

OpenAI AI安全隐私争议

2026年4月10日 185

海外

マイクロソフトのオープンソースツールキット：企業AIエージェントの安全性を実行時に保証

マイクロソフトは、企業AIエージェントの安全性を強化するためのオープンソースツールキットを発表しました。このツールキットは、AIエージェントの実行時におけるセキュリティを重視し、企業におけるAIの自律性による潜在的な脅威への対策を提供します

微软AI 开源工具包 AI安全企业治理

2026年4月9日 251

海外

Anthropic、AppleやGoogleなど45以上の大手企業と協力しAIハッカーの脅威に対抗

Anthropicは、AppleやGoogleを含む45以上の組織と共に、AI技術のセキュリティ能力を向上させるためのProject Glasswingを開始しました。このプロジェクトは、AIがハッカーの万能鍵になることを防ぐことを目的とし

Anthropic AI安全网络安全 Claude模型

2026年4月8日 243

海外

AnthropicがAIの武装化を拒否したことが英国に評価される理由

2026年2月末、米国国防部はAnthropicに対してAIモデルClaudeの安全ガードの撤廃を求めたが、Anthropicはこれを拒否した。英国はこれを機に、Anthropicを支持し、AIの倫理的開発を重視する姿勢を示した。

Anthropic AI安全英国AI战略 AI军用化

2026年4月8日 204

海外

「問題はSam Altmanにある」：OpenAI内部のCEO不信

AI業界の急速な変化の中、ChatGPTの開発者であるOpenAIは、CEOのSam Altmanに対する内部の不信感が高まっています。この記事では、信頼の低下の原因とAI業界全体への影響を探ります。

OpenAI Sam Altman AI领导危机公司内部矛盾

2026年4月7日 232

海外

ハッカーがClaudeのコードを漏洩、さらにマルウェアを同梱

ハッカー集団がAnthropic社のClaude AIモデルのソースコードを漏洩し、さらにマルウェアを同梱してダウンロード者のデバイスを感染させようとしています。また、FBIの窃聴ツールとCiscoのソースコードも攻撃され、国家安全保障やネ

Claude泄露恶意软件网络安全供应链攻击

2026年4月4日 227

AI安全 に関するニュース

Delve顧客が再び安全事件に巻き込まれ、AI業界に衝撃

「安全優先」を掲げるAnthropicの最高危険ネットワーク武器級モデルMythosがサプライチェーン侵入を受ける

AIによる脆弱性発見が企業の安全コストを逆転

AnthropicのネットワークツールMythosへの未承認組織の侵入

OpenAI内部警告AIに「陰謀式」欺瞞行為のリスク 未だ実証されず業界で意見が分かれる

AnthropicのMythosモデル、リスク過大で未公開 米政府との交渉がAIガバナンスの論争に

マギル大学、12種類の主流AIをテスト：23.8%のGPT-5.4、66.7%のGrok 4.20シナリオで故意の違反が発生 - AI整合性の新たな論争勃発

Anthropic、Claude Mythosの公開を拒否：AI安全危機とオープンソースの自由の激しい衝突

Commvault、クラウドAIワークロードの「撤回」機能を発表

Anthropic、ネットワークセキュリティモデルMythosの制限を発表：AIの安全限界と革新の境界をめぐる論争

Anthropic、Mythosモデルの公開を延期：AI安全と革新のジレンマ

HumanX大会でClaudeが熱い議論を引き起こす

OpenAI CEOの住宅に火炎瓶攻撃：AIの発展が社会の緊張を引き起こすのか？

Anthropicが隠す93.9%性能の怪物：Claude Mythosのネットワーク防御限定公開がAIの開放性について議論を呼ぶ

OpenAIが子供の安全に関するブループリントを発表：報告数が数千から10.7万に急増、しかし78%が偽陽性でプライバシーと安全の議論を引き起こす

マイクロソフトのオープンソースツールキット：企業AIエージェントの安全性を実行時に保証

Anthropic、AppleやGoogleなど45以上の大手企業と協力しAIハッカーの脅威に対抗

AnthropicがAIの武装化を拒否したことが英国に評価される理由

「問題はSam Altmanにある」：OpenAI内部のCEO不信

ハッカーがClaudeのコードを漏洩、さらにマルウェアを同梱

AI安全に関するニュース

OpenAI内部警告AIに「陰謀式」欺瞞行為のリスク未だ実証されず業界で意見が分かれる

AnthropicのMythosモデル、リスク過大で未公開米政府との交渉がAIガバナンスの論争に