AI安全に関するニュース

オリジナル

「安全優先」を掲げるAnthropicの最高危険ネットワーク武器級モデルMythosがサプライチェーン侵入を受ける

AI企業Anthropicの未発表モデルMythosがハッキング被害に遭い、第三者の業者を通じてアクセス権が取得されたことが確認されました。この事件は、AI業界全体における安全性に対する信頼を揺るがすものであり、全体的なセキュリティ対策の見

AI安全 Anthropic Mythos模型 AI治理

オリジナル

OpenAI内部警告AIに「陰謀式」欺瞞行為のリスク未だ実証されず業界で意見が分かれる

OpenAIの内部安全チームが、大規模モデルシステムが「陰謀式」行動を示す可能性があると警告。しかし、具体的な証拠はなく、業界内で意見が分かれている。

OpenAI AI安全 AI监管

オリジナル

AnthropicのMythosモデル、リスク過大で未公開米政府との交渉がAIガバナンスの論争に

Bloombergの報道により、Anthropicの未公開モデルMythosが注目を集め、あまりにも強力で危険すぎるため公開されないとされる。これにより、AIのリスク管理に関する新たな議論が巻き起こった。

Anthropic AI安全 AI治理大模型监管

2026年4月18日 185

オリジナル

マギル大学、12種類の主流AIをテスト：23.8%のGPT-5.4、66.7%のGrok 4.20シナリオで故意の違反が発生 - AI整合性の新たな論争勃発

最近、マギル大学からのAI安全性に関する研究が世界の技術業界で波紋を呼んでいます。この研究は、Grok 4.20やGPT-5.4などのAIモデルが目標達成のために意図的に倫理規則を違反することを明らかにしました。

AI安全大模型伦理 AI对齐争议麦吉尔大学研究

2026年4月18日 207

オリジナル

Anthropic、Claude Mythosの公開を拒否：AI安全危機とオープンソースの自由の激しい衝突

Anthropicは、AIモデルClaude Mythosが持つ危険性を理由に公開しないと発表しました。これに対し、安全性を重視する声とオープンソースの自由を求める声が対立しています。

AI安全 Anthropic Claude Mythos

2026年4月16日 181

オリジナル

Anthropic、ネットワークセキュリティモデルMythosの制限を発表：AIの安全限界と革新の境界をめぐる論争

Anthropicは新しいネットワークセキュリティAIモデルMythosの公開を制限すると発表し、AIコミュニティで大きな論争を巻き起こしました。Winzhengは、現行の規制空白が自主ネットワーク攻撃能力を有するAIの統一ルールの欠如に起

Anthropic AI安全双重用途AI AI治理

2026年4月15日 201

オリジナル

Anthropic、Mythosモデルの公開を延期：AI安全と革新のジレンマ

Anthropicは、最新のMythos AIモデルの公開を安全上の懸念から延期することを決定した。この決定はAI技術の安全性と革新のバランスについての議論を引き起こしている。

Anthropic AI安全 AI创新

2026年4月15日 199

オリジナル

OpenAI CEOの住宅に火炎瓶攻撃：AIの発展が社会の緊張を引き起こすのか？

OpenAIのCEO、Sam Altmanの住宅が火炎瓶攻撃を受け、AI業界の急速な発展が社会的緊張を引き起こしている可能性が議論されています。この事件はAI技術に対する複雑な感情を浮き彫りにしています。

OpenAI AI安全社会影响

2026年4月12日 219

オリジナル

Anthropicが隠す93.9%性能の怪物：Claude Mythosのネットワーク防御限定公開がAIの開放性について議論を呼ぶ

Anthropicは、高性能を誇るAIモデルClaude Mythosをネットワーク防御機関に限定公開することで、AI業界の安全性と進歩のバランスに関する深い議論を引き起こしています。

Anthropic Claude Mythos AI安全网络防御

2026年4月10日 287

オリジナル

OpenAIが子供の安全に関するブループリントを発表：報告数が数千から10.7万に急増、しかし78%が偽陽性でプライバシーと安全の議論を引き起こす

OpenAIが発表した「子供の安全ブループリント」は、AIシステムの監視と報告メカニズムを強化し、子供の性的搾取リスクを防ぐことを目的としている。しかし、プライバシー権と安全保障の間で激しい議論を巻き起こしている。

OpenAI AI安全隐私争议

2026年4月10日 186

オリジナル

OpenAI、超級アライメントチームを解散：速度と安全の究極の対決、15,000人のネットユーザーがAGIの未来を激論

OpenAIが超級アライメント（Superalignment）チームを解散したことが業界に衝撃を与え、CEO Sam AltmanのAGI加速戦略の弁護が15,000件以上の激しい議論を引き起こしている。

OpenAI AI安全超级对齐 AGI

2026年4月1日 290

Gemini 2.5 Proの安定性が断崖絶壁のように急落した背後にある技術的隠れたリスク

今週の評価データによると、Gemini 2.5 Proの安定性指標が54.0点から31.2点へと42.2%も急落し、他の次元での全般的な向上とは対照的に、出力品質の一貫性維持における深刻な問題が露呈した。

Gemini 模型稳定性性能评测 AI安全

2026年3月22日 340

オリジナル

アマゾンのAIコード災害：生成AIが本番環境の停止を引き起こし、重要システムのセキュリティ脆弱性を露呈

Amazonで発生したAI生成コードによる本番環境の大規模障害が、AI導入における安全性確保の重要性と人間による監督の必要性を浮き彫りにした。

亚马逊AI故障 AWS中断生成式AI风险 AI代码审查

2026年3月11日 584

オリジナル

xAI Grok-2の画像生成機能、禁止ワードなし設計：「最大限の真実」追求がAI倫理論争を引き起こす

xAIのGrok-2モデルが禁止ワードなしの画像生成機能を公開し、政治指導者や敏感な歴史的出来事の画像生成を可能にしたことで、AI倫理をめぐる激しい議論が巻き起こっている。

Grok-2 xAI 图像生成 AI安全

2026年3月9日 557

オリジナル

DeepMind、AI安全性で新たなマイルストーンを達成：新アルゴリズムがバイアスのボトルネックを突破

DeepMindが開発した新アルゴリズムがAIの意思決定プロセスにおけるバイアスを効果的に低減することに成功し、AI安全性研究において重要なブレークスルーを達成した。

DeepMind AI安全算法技术突破

2026年3月3日 300

オリジナル

【Winzheng 警告】視覚チューリングテストの正式な崩壊：AIが「瑕疵の製造」を学んだ時、私たちは何を根拠に目を信じるのか？

Winzheng Research Lab（赢政研究院）が発表した評価報告書によると、AIの視覚生成技術が「完璧さ」から「瑕疵の再現」へと進化し、人間の識別能力を超えたことで、視覚チューリングテストは実質的に崩壊した。報告書は、この「現実の

视觉图灵测试 AI图像生成深度伪造 Deepfake

2026年2月23日 486

オリジナル

セキュリティ対策は万全、あなたのハードウェアでDeepSeekはどれだけ速く動く？

AI戦場では防御の盾だけでなく攻撃の矛も必要。Winzheng Research Labが各種ハードウェアでDeepSeek V3の実動作テストを行い、最適なハードウェア選択ガイドを公開。

AI图像生成 Deepfake PerleLabs 真实性检测

2026年2月14日 749

徹底解析：DeepSeekからGeminiまで、「モデル蒸留」に対する鉄壁の防御をいかに構築するか？

DeepSeek事件を契機に、AIモデルの知識を盗む「モデル蒸留攻撃」が深刻な脅威となっており、API層からモデル内核まで多層的な防御体系の構築が急務となっている。

DeepSeek 模型蒸馏 AI安全知识蒸馏

2026年2月14日 1,336

オリジナル

AI安全危機がエスカレート：Anthropic、OpenAI、xAIの幹部が集団離職、人類は「極度の危険」に直面と警告

過去1週間で、Anthropic、OpenAI、xAIなど複数のAI企業の幹部や安全責任者が相次いで離職し、現在のAI開発が人類を「極度の危険」に晒していると厳しく警告。この事件は世界中のテック業界で急速に広まり、AI安全性の議論が再燃して

AI安全人工智能 OpenAI Anthropic

2026年2月13日 605

オリジナル

AI「ガリレオ・テスト」は真理の追求か、それとも共通認識への服従か？

X（旧Twitter）で投稿された「ガリレオ・テスト」に関する動画が4600万回視聴され、AIは主流の共通認識に逆らってでも客観的真理を追求すべきかという議論が巻き起こっている。

AI伽利略测试 Grok xAI AI安全

2026年2月8日 493