Qwen2.5-Max中国語MMLU基準で首位獲得:アリババ通義千問がGPT-4oを超えて熱い議論を呼ぶ
アリババクラウドの通義千問チームが発表したQwen2.5-Maxモデルが、権威ある中国語MMLU基準テストで86.1%のスコアを記録し、OpenAIのGPT-4o(85.8%)を超えて中国語大規模モデルの首位に躍り出た。この躍進により24時
アリババクラウドの通義千問チームが発表したQwen2.5-Maxモデルが、権威ある中国語MMLU基準テストで86.1%のスコアを記録し、OpenAIのGPT-4o(85.8%)を超えて中国語大規模モデルの首位に躍り出た。この躍進により24時
アリババクラウドが発表したQwen2-72B-InstructがMeta社のLlama3-70B-Instructを複数の権威あるベンチマークテストで上回り、特に中英バイリンガル能力で際立った性能を示したことで、オープンソースコミュニティで
アリババクラウドが数百億パラメータ規模の大規模言語モデルQwen2.5-Maxを発表し、数学推論とコーディング能力でGoogleのGemini 1.5 Proを上回る性能を示した。オープンソース・無料戦略により中国AIコミュニティで大きな注
阿里クラウドの通義千問チームが発表したQwen2.5-Maxモデルは、多くの権威ある基準テストでOpenAIのGPT-4oを超え、中国のAIコミュニティで大きな話題となっています。
アリババクラウドのQwen2.5-MaxモデルがArena-Hardランキングでトップに立ち、GPT-4oを超えたことで、AI業界において大きな話題となっています。この成果は、中国のAIが性能面で重要な突破を果たしたことを示し、128Kの超