模型评测异常に関するニュース

11個のAIモデルが一斉に40点急上昇：プログラミングテストで何が起きたのか？

11個のAIモデルのプログラミング能力が1週間で一斉に約40点急上昇した異常なデータの背後には、中国製モデルの全面的なリード、OpenAIの急落、長文処理能力の重要性向上という3つの重要なシグナルが隠されている。