レビュー 11個のAIモデルが一斉に40点急上昇:プログラミングテストで何が起きたのか? 11個のAIモデルのプログラミング能力が1週間で一斉に約40点急上昇した異常なデータの背後には、中国製モデルの全面的なリード、OpenAIの急落、長文処理能力の重要性向上という3つの重要なシグナルが隠されている。 DeepSeek GPT-o3 编程能力测试 模型评测异常 2026年3月22日 268