Qwen3.7-Max発表:エージェント時代の旗艦モデル、35時間の無人カーネル最適化をサポート
Qwen3.7-Maxの発表が確認され、AIがエージェント時代へ進む重要な一歩を示した。エンドツーエンドのコーディング、マルチファイルリファクタリング、35時間の無人カーネル最適化タスクをサポートし、ツール呼び出しは1000回を超え、長時間
Qwen3.7-Maxの発表が確認され、AIがエージェント時代へ進む重要な一歩を示した。エンドツーエンドのコーディング、マルチファイルリファクタリング、35時間の無人カーネル最適化タスクをサポートし、ツール呼び出しは1000回を超え、長時間
WDCD Run #105のデータは、Agent化が進む大規模モデルが「機能は正しいが制約違反」という危険な出力を生成する問題を浮き彫りにし、Q239では11モデル全てが100%制約を破り、ブレーキ能力の欠如を示している。
GPT-4oが「厳格ツール呼び出し」機能の導入により壊滅的なパフォーマンス低下を経験し、使用可能性スコアが100点から65点に暴落。過度に慎重な動作により実用性を失った。