AI分野で最も誤解されているグラフ
METR組織が作成する、計算資源とAIモデル性能の関係を示すグラフは、AI進歩の「晴雨表」として注目される一方、進歩の停滞を示すものとして誤解されることが多い。実際には、このグラフは特定タスクの限界を示しているに過ぎず、AI発展の新たな方向
METR組織が作成する、計算資源とAIモデル性能の関係を示すグラフは、AI進歩の「晴雨表」として注目される一方、進歩の停滞を示すものとして誤解されることが多い。実際には、このグラフは特定タスクの限界を示しているに過ぎず、AI発展の新たな方向
Microsoftの研究チームが、大規模言語モデル(LLM)に隠された「スリーパーエージェント」バックドアを、トリガー条件や悪意ある出力を事前に知ることなく検出できる革新的なスキャン技術を発表した。
Anthropicは旗艦大規模言語モデルOpus 4.6を発表し、複数のAIエージェントが協働する「エージェントチーム」機能を中核に、AIエージェント技術の新時代を切り開きました。
AI評価機関METRの「計算フロンティアプロット」は業界の進歩を示す重要な指標となっているが、単純な性能対計算量のグラフではなく、AIの人間レベル能力への接近を測る複雑な指標であることが理解されていない。
Microsoftの研究チームが、トリガー条件や悪意のある出力を事前に知ることなく、オープンソースLLMに隠された「休眠エージェント」バックドアを検出できる革新的なスキャン手法を発表した。
『MITテクノロジーレビュー』のニュースレター『ダウンロード』最新号では、AI分野における評価の難しさと、AI時代のエネルギー需要に応える次世代原子力技術の進展を取り上げている。