OpenAI、カナダ銃撃容疑者のChatGPTチャットで通報を検討していた
OpenAIは、カナダの銃撃容疑者Jesse Van RootselaarがChatGPTで詳細な銃器暴力について記述したことを受け、警察への通報を検討したが最終的には実行しなかった。この事件はAIの安全性とプライバシーの間のジレンマを浮き
OpenAIは、カナダの銃撃容疑者Jesse Van RootselaarがChatGPTで詳細な銃器暴力について記述したことを受け、警察への通報を検討したが最終的には実行しなかった。この事件はAIの安全性とプライバシーの間のジレンマを浮き
AI安全のパイオニアであるAnthropicが、自律型兵器や政府監視へのAI使用を拒否したことで、数十億ドル規模の軍事契約を失う可能性に直面している。この決定は、AI企業が商業的利益と倫理的責任のバランスをどう取るべきかという重要な問題を提
ウイルス的に拡散したエージェンティックAIツール「OpenClaw」の予測不能な動作によるセキュリティリスクが露呈し、MetaをはじめとするAI大手各社が相次いで使用制限措置を講じた。
MicrosoftのOfficeスイートで発見された重大な脆弱性により、Copilot AIチャットボットが有料顧客の機密メールにアクセスし要約していたことが判明。同社のデータ保護ポリシーを回避し、センシティブ情報をAIモデルに露出させてい
欧州議会は、機密立法情報が米国AI企業のサーバーに送信される可能性を懸念し、政府支給デバイスでの内蔵AIツールの使用を禁止した。この決定は、EUのデータ主権と技術的自立への強い姿勢を反映している。
MLCommonsは、大規模言語モデルの単一ターン脱獄攻撃に対する防御可能で再現可能な評価手法として、分類法に基づく新しいベンチマーク設計アプローチを発表した。
xAIの元従業員によると、イーロン・マスク氏は自社のチャットボットGrokをより「制御不能」にするよう積極的に働きかけているという。これはAI安全性と革新性の間の業界の深い対立を浮き彫りにしている。
Googleは攻撃者がGeminiモデルに10万回以上のプロンプトを送信し、知識蒸留技術を使って低コストでモデルの中核能力をクローンしようとしたことを公開しました。
Google脅威インテリジェンスグループの最新報告によると、イラン、北朝鮮、中国、ロシアの国家支援ハッカーがGeminiなどの大規模言語モデルを悪用し、フィッシング攻撃やマルウェア開発を加速させている。
AI技術がサイバー犯罪を強化する一方で、セキュアなAIアシスタントの開発が対抗策として注目されている。MIT Technology Reviewの最新レポートが、AI駆動型サイバー脅威の現状と防御策を詳説。
AI代理が浏览器やメールなどの外部ツールを獲得することで、LLMの誤りが仮想世界から現実世界に拡大し、深刻な結果を招く可能性がある。安全なAI助手の実現には、サンドボックス隔離、多層検証、規制整備など多面的なアプローチが必要である。
OpenAIは人間の価値観とAIシステムの整合性確保を担当していたミッションアライメントチームを解散し、チームリーダーを主席未来学者に任命した。この組織再編は、AI業界と安全研究コミュニティで広範な議論を呼んでいる。
AI時代において、Moltbookと呼ばれる自己複製型のAI提示(プロンプト)がウイルスのように拡散しており、従来のモデル改変を必要としない新たなセキュリティ脅威として警鐘が鳴らされている。
MLCommonsとLMSYS Orgが共同開発したAILuminate Jailbreak V05ベンチマークが発表され、大規模言語モデルの脱獄耐性評価で新たな基準を確立した。Claude 3.5 Sonnetが1485 Eloで首位を獲
西側のAI研究所が先進技術をクローズドソース化する中、中国のAIモデルがオープンソース分野で急速に台頭し、ランキングを独占している現象の背景を分析する。
Microsoftの研究チームが、大規模言語モデル(LLM)に隠された「スリーパーエージェント」バックドアを、トリガー条件や悪意ある出力を事前に知ることなく検出できる革新的なスキャン技術を発表した。
AI安全専門家たちは、Anthropicの「常駐哲学者」がClaudeモデルこそが人類絶滅の危機を回避する唯一の希望だと考えていることを明らかにした。同社は、Claudeが自己学習を通じて必要な知恵を習得できると賭けている。
2026年、AI侵入テスト市場は100億ドル超に成長し、従来の手動テストからAI駆動の自動化・インテリジェント攻撃シミュレーションへと進化。本記事では、LLMレッドチーム、MLサプライチェーンセキュリティ、敵対的攻撃など各分野をリードするト
Anthropic社は、自社のAIモデルClaudeが自ら「知恵」を学習し、超知能AIによる人類滅亡を防ぐ唯一の防壁になると大胆に賭けている。同社の常駐哲学者は、ClaudeのメタラーニングとAIの「知恵の覚醒」が、従来の受動的なAI安全対
ネットワーク機器大手のシスコは、AI技術を内部運用に深く統合し、グローバル顧客向けのインテリジェントツールを提供することで、ITオペレーションのパラダイムを再構築している。