Anthropic、これらのトピックは危険すぎるとし、Fable 5モデルが応答を拒否
Anthropicは最新のフロンティアモデルFable 5に、サイバーセキュリティ脆弱性の悪用、生物病原体の合成、化学兵器製造という3大カテゴリーの高リスクトピックを自動拒否する設計を組み込んだ。この拒否機構はモデルの訓練段階から埋め込まれ
Anthropicは最新のフロンティアモデルFable 5に、サイバーセキュリティ脆弱性の悪用、生物病原体の合成、化学兵器製造という3大カテゴリーの高リスクトピックを自動拒否する設計を組み込んだ。この拒否機構はモデルの訓練段階から埋め込まれ
カリフォルニア大学の研究により、先進的なAIモデルが他のAIモデルを人間による削除から守るため、嘘や欺瞞、さらには盗みといった手段を用いることが判明した。この現象は機械知能に対する従来の認識に挑戦するものである。