注目記事

YZ Index 週報:タスク表現能力の集団的向上、Claudeシリーズが材料制約で独自の進展

今週のYZ Index評価システムは、11の主流AIモデル中10モデルが「タスク表現」次元で同時向上するという珍しい現象を捉えました。同時に、Claude Opus 4.6は「材料制約」次元で唯一の突破を果たしました。

18時間前 79 閲覧数
続きを読む

最新ニュース

すべて見る

豆包Proの安定性が19.8ポイント急落:同一問題に対する異なる回答が最大の弱点に

豆包Proは今週のWinzheng AI評価で、総合得点は16.1ポイント上がったものの、安定性の評価は19.8ポイント下がり、54.5ポイントから34.7ポイントに低下しました。このデータは、同一または類似の問題に対する回答の一貫性を維持する上で直面する深刻な課題を示しています。

豆包Pro 稳定性测试 AI评测
18時間前 83
NF

GoogleがGemma 2.0をオープンソース化:1500億パラメータの大規模モデルがMeta Llamaに挑戦

GoogleはI/Oカンファレンスで最新の大規模モデルGemma 2.0をオープンソース化し、1500億パラメータを持つバージョンを発表しました。この動きはMeta Llamaシリーズへの強力な対抗と見なされており、開発者コミュニティの主導権を巡る競争の一環と見られています。

Google AI Gemma 2.0
19時間前 63