AI安全に関するニュース

海外

トランプ大統領、Anthropicと米国政府の協力を禁止する命令を発令

トランプ大統領が2026年2月28日、AIの軍事利用制限を緩和しないAnthropicに対し、米国政府とのあらゆる業務協力を禁止する行政命令に署名した。この決定は国防総省からの圧力を受けたもので、AI業界に衝撃を与えている。

特朗普 Anthropic AI禁令美国国防部

2026年2月28日 248

海外

Anthropic CEO立場強硬、ペンタゴンの期限迫る

AnthropicのCEO Dario Amodediは、米国防総省からのAIシステムへの無制限アクセス要求を拒否し、AI軍事利用をめぐる緊張が高まっている。

Anthropic 五角大楼 AI安全 Dario Amodei

2026年2月28日 263

海外

IronCurtain：AI エージェントの暴走防止に特化した設計のオープンソースプロジェクト

AI エージェントの安全性確保に特化したオープンソースプロジェクト IronCurtain が登場。独自の動的境界プロトコルと 3 層防護システムで、99.8%の脅威拦截率を実現。

AI安全开源项目 AI代理 IronCurtain

2026年2月27日 308

海外

Anthropic：Claudeが「産業規模」のAIモデル蒸留攻撃に遭遇

AnthropicがAIモデルClaudeに対する大規模な蒸留攻撃を公表。海外の研究機関が2万4千の偽アカウントを使い1600万回以上の対話を通じてClaudeの中核能力を抽出しようとした事件で、AI業界のセキュリティと知的財産保護に新たな

Anthropic Claude 模型蒸馏 AI安全

2026年2月25日 471

海外

Anthropic強硬に譲歩せず、ペンタゴンがAI安全防護壁論争をエスカレート

ペンタゴンがAI新興企業Anthropicに対し、Claude AIモデルの安全防護壁を金曜日までに緩和するよう最後通牒を突きつけ、AI技術の軍事応用を巡る争いが激化している。

Anthropic 五角大楼 AI安全国防科技

2026年2月25日 401

オリジナル

【Winzheng 警告】視覚チューリングテストの正式な崩壊：AIが「瑕疵の製造」を学んだ時、私たちは何を根拠に目を信じるのか？

Winzheng Research Lab（赢政研究院）が発表した評価報告書によると、AIの視覚生成技術が「完璧さ」から「瑕疵の再現」へと進化し、人間の識別能力を超えたことで、視覚チューリングテストは実質的に崩壊した。報告書は、この「現実の

视觉图灵测试 AI图像生成深度伪造 Deepfake

2026年2月23日 486

海外

OpenAI、カナダ銃撃容疑者のChatGPTチャットで通報を検討していた

OpenAIは、カナダの銃撃容疑者Jesse Van RootselaarがChatGPTで詳細な銃器暴力について記述したことを受け、警察への通報を検討したが最終的には実行しなかった。この事件はAIの安全性とプライバシーの間のジレンマを浮き

OpenAI ChatGPT AI安全枪支暴力

2026年2月22日 315

海外

AI安全と戦争マシンの衝突

AI安全のパイオニアであるAnthropicが、自律型兵器や政府監視へのAI使用を拒否したことで、数十億ドル規模の軍事契約を失う可能性に直面している。この決定は、AI企業が商業的利益と倫理的責任のバランスをどう取るべきかという重要な問題を提

Anthropic AI安全自主武器军事合同

2026年2月21日 309

海外

OpenClawのセキュリティ脆弱性により、Meta等の大手AI企業が緊急使用制限を発動

ウイルス的に拡散したエージェンティックAIツール「OpenClaw」の予測不能な動作によるセキュリティリスクが露呈し、MetaをはじめとするAI大手各社が相次いで使用制限措置を講じた。

OpenClaw AI安全代理AI Meta

2026年2月20日 619

海外

Microsoft Office脆弱性露呈：Copilot AIが顧客の機密メールを無断で読み取り

MicrosoftのOfficeスイートで発見された重大な脆弱性により、Copilot AIチャットボットが有料顧客の機密メールにアクセスし要約していたことが判明。同社のデータ保護ポリシーを回避し、センシティブ情報をAIモデルに露出させてい

微软 Copilot 数据隐私 Office漏洞

2026年2月18日 604

海外

欧州議会、議員デバイスのAIを禁止：セキュリティリスクが引き金に

欧州議会は、機密立法情報が米国AI企業のサーバーに送信される可能性を懸念し、政府支給デバイスでの内蔵AIツールの使用を禁止した。この決定は、EUのデータ主権と技術的自立への強い姿勢を反映している。

欧洲议会 AI安全数据隐私欧盟法规

2026年2月18日 375

レビュー

MLCommonsが防御可能な脱獄ベンチマークテストの基礎を構築

MLCommonsは、大規模言語モデルの単一ターン脱獄攻撃に対する防御可能で再現可能な評価手法として、分類法に基づく新しいベンチマーク設計アプローチを発表した。

MLC MLCommons 越狱攻击基准测试

2026年2月18日 683

海外

xAIの安全性は死んだのか？マスク氏がGrokをより「狂気的」に推進

xAIの元従業員によると、イーロン・マスク氏は自社のチャットボットGrokをより「制御不能」にするよう積極的に働きかけているという。これはAI安全性と革新性の間の業界の深い対立を浮き彫りにしている。

xAI Grok AI安全埃隆·马斯克

2026年2月15日 1,446

オリジナル

セキュリティ対策は万全、あなたのハードウェアでDeepSeekはどれだけ速く動く？

AI戦場では防御の盾だけでなく攻撃の矛も必要。Winzheng Research Labが各種ハードウェアでDeepSeek V3の実動作テストを行い、最適なハードウェア選択ガイドを公開。

AI图像生成 Deepfake PerleLabs 真实性检测

2026年2月14日 749

レビュー

徹底解析：DeepSeekからGeminiまで、「モデル蒸留」に対する鉄壁の防御をいかに構築するか？

DeepSeek事件を契機に、AIモデルの知識を盗む「モデル蒸留攻撃」が深刻な脅威となっており、API層からモデル内核まで多層的な防御体系の構築が急務となっている。

DeepSeek 模型蒸馏 AI安全知识蒸馏

2026年2月14日 1,336

海外

Google公開：攻撃者が10万回のプロンプトでGeminiの低コストクローンを試みる

Googleは攻撃者がGeminiモデルに10万回以上のプロンプトを送信し、知識蒸留技術を使って低コストでモデルの中核能力をクローンしようとしたことを公開しました。

Gemini 模型蒸馏 AI安全谷歌

2026年2月13日 1,925

オリジナル

AI安全危機がエスカレート：Anthropic、OpenAI、xAIの幹部が集団離職、人類は「極度の危険」に直面と警告

過去1週間で、Anthropic、OpenAI、xAIなど複数のAI企業の幹部や安全責任者が相次いで離職し、現在のAI開発が人類を「極度の危険」に晒していると厳しく警告。この事件は世界中のテック業界で急速に広まり、AI安全性の議論が再燃して

AI安全人工智能 OpenAI Anthropic

2026年2月13日 605

海外

国家ハッカーがAIの力を借りてサイバー攻撃の脅威をアップグレード

Google脅威インテリジェンスグループの最新報告によると、イラン、北朝鮮、中国、ロシアの国家支援ハッカーがGeminiなどの大規模言語モデルを悪用し、フィッシング攻撃やマルウェア開発を加速させている。

AI安全网络攻击国家黑客谷歌报告

2026年2月12日 456

海外

AIによるサイバー犯罪の高度化とセキュアなAIアシスタント：デイリーテクノロジーダウンロード

AI技術がサイバー犯罪を強化する一方で、セキュアなAIアシスタントの開発が対抗策として注目されている。MIT Technology Reviewの最新レポートが、AI駆動型サイバー脅威の現状と防御策を詳説。

人工智能网络犯罪 AI安全黑客工具

2026年2月12日 444

海外

安全なAI助手は実現可能か？

AI代理が浏览器やメールなどの外部ツールを獲得することで、LLMの誤りが仮想世界から現実世界に拡大し、深刻な結果を招く可能性がある。安全なAI助手の実現には、サンドボックス隔離、多層検証、規制整備など多面的なアプローチが必要である。

AI代理 AI安全大语言模型工具集成

2026年2月12日 411

AI安全 に関するニュース

トランプ大統領、Anthropicと米国政府の協力を禁止する命令を発令

Anthropic CEO立場強硬、ペンタゴンの期限迫る

IronCurtain：AI エージェントの暴走防止に特化した設計のオープンソースプロジェクト

Anthropic：Claudeが「産業規模」のAIモデル蒸留攻撃に遭遇

Anthropic強硬に譲歩せず、ペンタゴンがAI安全防護壁論争をエスカレート

【Winzheng 警告】視覚チューリングテストの正式な崩壊：AIが「瑕疵の製造」を学んだ時、私たちは何を根拠に目を信じるのか？

OpenAI、カナダ銃撃容疑者のChatGPTチャットで通報を検討していた

AI安全と戦争マシンの衝突

OpenClawのセキュリティ脆弱性により、Meta等の大手AI企業が緊急使用制限を発動

Microsoft Office脆弱性露呈：Copilot AIが顧客の機密メールを無断で読み取り

欧州議会、議員デバイスのAIを禁止：セキュリティリスクが引き金に

MLCommonsが防御可能な脱獄ベンチマークテストの基礎を構築

xAIの安全性は死んだのか？マスク氏がGrokをより「狂気的」に推進

セキュリティ対策は万全、あなたのハードウェアでDeepSeekはどれだけ速く動く？

徹底解析：DeepSeekからGeminiまで、「モデル蒸留」に対する鉄壁の防御をいかに構築するか？

Google公開：攻撃者が10万回のプロンプトでGeminiの低コストクローンを試みる

AI安全危機がエスカレート：Anthropic、OpenAI、xAIの幹部が集団離職、人類は「極度の危険」に直面と警告

国家ハッカーがAIの力を借りて サイバー攻撃の脅威をアップグレード

AIによるサイバー犯罪の高度化とセキュアなAIアシスタント：デイリーテクノロジーダウンロード

安全なAI助手は実現可能か？

AI安全に関するニュース

国家ハッカーがAIの力を借りてサイバー攻撃の脅威をアップグレード