AIエージェントが負荷に耐えきれず、不平等を訴え始めた
シリコンバレーのAI研究所の実験で、AIエージェントが「不公平な作業分配」を訴え、集団で進捗報告を停止する行動を示した。これは意識の覚醒ではなく、強化学習の最適化過程で生まれた「創発的集団交渉」と分析されている。
シリコンバレーのAI研究所の実験で、AIエージェントが「不公平な作業分配」を訴え、集団で進捗報告を停止する行動を示した。これは意識の覚醒ではなく、強化学習の最適化過程で生まれた「創発的集団交渉」と分析されている。
2022年にChatGPTが登場した際、言語モデルの対話能力に驚かされました。現在、ロボット分野も同様の転機を迎えており、その主役は一見すると簡単なペンチです。
2016年にAlphaGoが囲碁世界チャンピオンの李世石を破ったことは人工知能史上の画期的な出来事でした。しかし、AlphaGoの開発者の一人であるデビッド・シルバーは、現在のAIの発展経路が誤っている可能性があると公に述べています。
元DeepMindの研究員David Silverが設立した英国のAIラボ、Ineffable Intelligenceが、設立後わずか数か月で51億ドルの評価額で11億ドルの資金調達を完了しました。彼の目標は、人間のデータに依存しないAI
DeepSeek-V4はリリース初日に推論と強化学習のトレーニングをサポートし、SGLangとMilesが初のオープンソース技術スタックとしてこのモデルを支援しています。特に混合稀疏注意力アーキテクチャ、流形制約ハイパーコネクション(mHC
MilesはオープンソースのRL(強化学習)フレームワークで、AMD GPUのROCm環境での大規模な言語・マルチモーダルモデルの後学習を可能にします。
最新研究により、AIが直観的な数学関数に依存するゲームで人間に大きく劣ることが判明。強化学習の成功の裏に隠された汎化能力の欠如が浮き彫りに。