レビュー GPT-4o崩壊:エンジニアが最も信頼するAIの判断力が0点に転落 最新のAI評価でGPT-4oがコードのバグ検出テストで100点から0点に転落し、基本的な判断力の喪失という深刻な問題が露呈した。 GPT-4o 编程能力 代码审查 工程实践 2026年3月21日 207
レビュー 文心4.0の一行コードが致命的欠陥を露呈:AIが辞書すら認識できない時 文心一言4.0がPythonの基礎的な辞書内包表記で完全に失敗し、リスト形式で出力した上に謎の数字まで追加するという前代未聞のAI劣化事例が発生した。 文心一言4.0 编程能力 代码生成 模型退化 2026年3月21日 306