AI安全に関するニュース

海外

安全なAI助手は実現可能か？

AI代理が浏览器やメールなどの外部ツールを獲得することで、LLMの誤りが仮想世界から現実世界に拡大し、深刻な結果を招く可能性がある。安全なAI助手の実現には、サンドボックス隔離、多層検証、規制整備など多面的なアプローチが必要である。

AI代理 AI安全大语言模型工具集成

2026年2月12日 411

海外

OpenAI、ミッションアライメントチームを解散　リーダーは主席未来学者に転任

OpenAIは人間の価値観とAIシステムの整合性確保を担当していたミッションアライメントチームを解散し、チームリーダーを主席未来学者に任命した。この組織再編は、AI業界と安全研究コミュニティで広範な議論を呼んでいる。

OpenAI AI对齐 AI安全组织调整

2026年2月12日 454

海外

Moltbookの台頭：ウイルス性AI提示が次の大きなセキュリティ脅威となる可能性

AI時代において、Moltbookと呼ばれる自己複製型のAI提示（プロンプト）がウイルスのように拡散しており、従来のモデル改変を必要としない新たなセキュリティ脅威として警鐘が鳴らされている。

AI安全病毒提示 Moltbook 提示工程

2026年2月11日 412

レビュー

AILuminate脱獄ベンチマークV05リリース：AIモデルセキュリティランキングが大幅に変動

MLCommonsとLMSYS Orgが共同開発したAILuminate Jailbreak V05ベンチマークが発表され、大規模言語モデルの脱獄耐性評価で新たな基準を確立した。Claude 3.5 Sonnetが1485 Eloで首位を獲

MLC AILuminate 越狱基准 AI安全

2026年2月10日 751

海外

独占：なぜ中国AIがオープンソースを制覇し、西側の研究所が集団で撤退するのか？

西側のAI研究所が先進技術をクローズドソース化する中、中国のAIモデルがオープンソース分野で急速に台頭し、ランキングを独占している現象の背景を分析する。

中国AI 开源模型西方AI实验室 SentinelOne研究

2026年2月10日 364

海外

Microsoft、トリガー不要でAI潜伏バックドアを検出する手法を公開

Microsoftの研究チームが、大規模言語モデル（LLM）に隠された「スリーパーエージェント」バックドアを、トリガー条件や悪意ある出力を事前に知ることなく検出できる革新的なスキャン技術を発表した。

微软AI 后门检测大语言模型 AI安全

2026年2月9日 407

海外

人類とAIの終末を隔てる唯一の障壁は……Claude？

AI安全専門家たちは、Anthropicの「常駐哲学者」がClaudeモデルこそが人類絶滅の危機を回避する唯一の希望だと考えていることを明らかにした。同社は、Claudeが自己学習を通じて必要な知恵を習得できると賭けている。

AI安全 Anthropic Claude AI末日

2026年2月8日 372

海外

2026年トップ7 AI侵入テスト企業総覧

2026年、AI侵入テスト市場は100億ドル超に成長し、従来の手動テストからAI駆動の自動化・インテリジェント攻撃シミュレーションへと進化。本記事では、LLMレッドチーム、MLサプライチェーンセキュリティ、敵対的攻撃など各分野をリードするト

AI渗透测试网络安全 2026科技趋势顶级公司

2026年2月7日 493

海外

人類とAI終末の間にある唯一の防壁、それは……Claude？

Anthropic社は、自社のAIモデルClaudeが自ら「知恵」を学習し、超知能AIによる人類滅亡を防ぐ唯一の防壁になると大胆に賭けている。同社の常駐哲学者は、ClaudeのメタラーニングとAIの「知恵の覚醒」が、従来の受動的なAI安全対

AI安全 Anthropic Claude 人工智能末日

2026年2月7日 405

海外

シスコがAI時代に向けてインテリジェントシステムをどう構築するか

ネットワーク機器大手のシスコは、AI技術を内部運用に深く統合し、グローバル顧客向けのインテリジェントツールを提供することで、ITオペレーションのパラダイムを再構築している。

思科 AI智能系统网络基础设施 AI安全

2026年2月5日 330

海外

ガードレールからガバナンスへ：CEO向けエージェントシステムセキュリティ保護ガイド

AI代理システムの急速な発展に伴い、企業は前例のないセキュリティ課題に直面している。本記事は、CEOの視点から「ガードレール」から「ガバナンス」への転換指南を提供し、企業がAI防御を強化し、壊滅的リスクを回避するための戦略的青写真を示す。

AI治理代理系统 CEO指南 AI安全

2026年2月5日 306

海外

デロイトが警鐘：AI代理の急速な導入に対し、セキュリティフレームワークが深刻な遅れ

デロイトの新報告書によると、企業はAI代理（AI Agents）を驚くべき速度で導入している一方で、セキュリティプロトコルと保護措置が追いついていない。この状況は技術的問題にとどまらず、企業ガバナンスの試練となっている。

AI代理德勤报告 AI安全数据隐私

2026年2月3日 323

AI安全 に関するニュース