Qwen2.5-Max中国語MMLU基準で首位獲得:アリババ通義千問がGPT-4oを超えて熱い議論を呼ぶ
アリババクラウドの通義千問チームが発表したQwen2.5-Maxモデルが、権威ある中国語MMLU基準テストで86.1%のスコアを記録し、OpenAIのGPT-4o(85.8%)を超えて中国語大規模モデルの首位に躍り出た。この躍進により24時
アリババクラウドの通義千問チームが発表したQwen2.5-Maxモデルが、権威ある中国語MMLU基準テストで86.1%のスコアを記録し、OpenAIのGPT-4o(85.8%)を超えて中国語大規模モデルの首位に躍り出た。この躍進により24時
アリババクラウドが数百億パラメータ規模の大規模言語モデルQwen2.5-Maxを発表し、数学推論とコーディング能力でGoogleのGemini 1.5 Proを上回る性能を示した。オープンソース・無料戦略により中国AIコミュニティで大きな注
阿里クラウドの通義千問チームが発表したQwen2.5-Maxモデルは、多くの権威ある基準テストでOpenAIのGPT-4oを超え、中国のAIコミュニティで大きな話題となっています。
アリババクラウドのQwen2.5-MaxモデルがArena-Hardランキングでトップに立ち、GPT-4oを超えたことで、AI業界において大きな話題となっています。この成果は、中国のAIが性能面で重要な突破を果たしたことを示し、128Kの超