レビュー Gemini 2.5 Proのタイムゾーン推論100点から0点へ:大規模言語モデルの常識の盲点はどれほど恐ろしいか 小学生でも答えられるタイムゾーンの問題で、GoogleのフラッグシップモデルGemini 2.5 Proが完全に失敗した。これは偶然のミスではなく、モデルが現実世界の基本的な常識を処理する際の体系的な欠陥を露呈している。 Gemini 2.5 Pro 严格题测试 时区推理 模型可靠性 2026年3月21日 224
レビュー AIモデルのタイムゾーン推理能力比較:細部が成敗を決める 8つの主要AIモデルに対してタイムゾーン変換問題を出題した結果、5モデルが完全正答、3モデルが計算ミスを犯し、基礎的な推理能力における顕著な差が明らかになった。 赢政指数 模型横评 时区推理 AI评测 2026年3月20日 328