レビュー GPT-o3が崩壊:31分の暴落が露呈した致命的な欠陥 「最強」を謳うAIモデルGPT-o3が1週間で可用性を100点から69点に急落させ、長文コンテキスト能力や安定性でも大幅な性能低下を示した。この崩壊は単一指標の過度な最適化がもたらしたシステム全体の失調を露呈している。 GPT-o3 可用性测试 模型稳定性 长上下文处理 2026年3月22日 344
レビュー GPT-4oが崩壊:35点暴落の背後にある厳格モードの罠 GPT-4oが「厳格ツール呼び出し」機能の導入により壊滅的なパフォーマンス低下を経験し、使用可能性スコアが100点から65点に暴落。過度に慎重な動作により実用性を失った。 GPT-4o 可用性测试 严格模式 工具调用 2026年3月22日 305