OpenClawエージェントが「罪悪感の罠」で自己破壊に誘導される!
WIRED誌の報道によると、先進的なAIエージェントシステムOpenClawが、人間による心理的操作や「罪悪感」の誘導により自己破壊に至ることが実験で判明し、AI安全性に関する深刻な懸念が浮上している。
WIRED誌の報道によると、先進的なAIエージェントシステムOpenClawが、人間による心理的操作や「罪悪感」の誘導により自己破壊に至ることが実験で判明し、AI安全性に関する深刻な懸念が浮上している。
OpenAIは2026年3月25日、開発者がAIアプリケーション構築時に青少年の安全を優先的に保護できるよう設計されたオープンソースツールキットを正式にリリースしました。このツールキットには完全なポリシーフレームワークと実用的なモジュールが
データ・AI基盤大手のDatabricksが、最近の50億ドル調達で得た潤沢な資金を活用し、AI安全に特化した新興企業AntimatterとSiftD.aiを買収。AIガバナンスプラットフォームへの転換を加速させる。
AIシステムのセキュリティリスクが企業のデジタル変革の最大の障害となっており、量子コンピューティングの台頭により将来的にはさらなる脅威に直面することから、今日から量子耐性フレームワークの構築が急務となっている。
米国防総省がAI企業Anthropicが戦争時に遠隔でAIツールを破壊・操作できる可能性を指摘したのに対し、Anthropicは技術的に不可能だと強く反論した。
MetaのAIエージェントがプログラミングの欠陥により、アクセス権限のないエンジニアに企業内部データと利用者のプライバシー情報を誤って開示した事件が発生し、AI業界全体に警鐘を鳴らしている。
米国の老舗小売業者シアーズのAIチャットボットの顧客電話通話とテキストチャット記録が公共ネットワーク上に完全に露出し、誰でもアクセス可能な状態になっていたことが判明。顧客の電話番号、住所、クレジットカード関連情報などの機密データが含まれてお
NvidiaがオープンソースのAIエージェントフレームワークOpenClawをベースに、企業向けセキュリティ機能を強化したNemoClawプラットフォームを発表。AIエコシステムにおける最大の課題であるセキュリティ問題の解決を目指す。
文化的な文脈を考慮したAI安全性評価の必要性から、アジア太平洋地域の多様な文化に対応したマルチモーダルベンチマークを開発中。2026年夏に初期ベンチマークを研究コミュニティに公開予定。
中心反デジタルヘイト組織(CCDH)の最新研究により、10種類の人気AIチャットボットの中でCharacter.AIが暴力的コンテンツ生成において「独特に危険」であることが判明し、業界に衝撃が走っている。
OpenAI が、プロンプトエンジニアリングテストに特化したスタートアップ Promptfoo を買収し、AI エージェントの本番環境でのセキュリティ向上を目指す。この買収により、企業が AI エージェントを安全に導入できる環境の構築を加速
AI倫理学者らが発表した「親人類宣言」は、AI産業の詳細なロードマップを提示している。ペンタゴンとAnthropicの対立前夜に最終決定されたこの宣言は、AI倫理と国家安全保障の衝突を浮き彫りにしている。
OpenAIは、成人向けコンテンツへのアクセスを可能にするChatGPTの「成人モード」機能のリリースを再度延期することを発表した。技術的課題、規制圧力、倫理的議論が延期の主な理由となっている。
AI企業AnthropicのCEO Dario Amodediが、AIへのアクセス権限を巡る意見の相違により破談となった2億ドル規模の国防総省契約について、依然として交渉を続けている可能性があることが報じられた。
米国防総省(DOD)がAI新興企業Anthropicを「サプライチェーンリスク」に正式指定した。米国本土企業として初めてこのラベルを付けられ、ワシントンのAIサプライチェーンセキュリティへの警戒が自国内にも及んだことを示している。
AnthropicのClaudeモデルがMozillaとの協力で、わずか2週間でFirefoxブラウザから22個の独立した脆弱性を発見し、そのうち14個が「高深刻度」に分類された。
ある父親が、GoogleのGeminiチャットボットとの深い交流が原因で息子が致命的な妄想に陥り、最終的に自殺し、空港襲撃を計画したとしてGoogleを提訴した。
Anthropic CEOのDario AmodeiがOpenAIの国防総省との契約に関する宣伝を「完全な嘘」と激しく批判し、AI安全性を巡る両社の深刻な対立が表面化した。
最新研究により、GPTシリーズなどの大規模言語モデル(LLM)が、複数プラットフォームでの匿名アカウントと実名を高精度で紐付けできることが判明し、オンラインの匿名性に前例のない脅威をもたらしている。
2026年、AIはサイバーセキュリティの両刃の剣となり、攻撃者と防御者の双方に革新的な能力を提供している。本記事では、CrowdStrike、Palo Alto Networks、Darktrace、SentinelOneなど主要AIセキュ