工具调用に関するニュース

オリジナル

Qwen3.7-Max発表：エージェント時代の旗艦モデル、35時間の無人カーネル最適化をサポート

Qwen3.7-Maxの発表が確認され、AIがエージェント時代へ進む重要な一歩を示した。エンドツーエンドのコーディング、マルチファイルリファクタリング、35時間の無人カーネル最適化タスクをサポートし、ツール呼び出しは1000回を超え、長時間

Qwen模型 AIエージェント工具调用

2026年5月23日 415

WDCDの視点：モデルが有用であるほど、ブレーキが必要

WDCD Run #105のデータは、Agent化が進む大規模モデルが「機能は正しいが制約違反」という危険な出力を生成する問題を浮き彫りにし、Q239では11モデル全てが100%制約を破り、ブレーキ能力の欠如を示している。

WDCD AI Agent 工具调用能力与约束

2026年5月10日 545

GPT-4oが崩壊：35点暴落の背後にある厳格モードの罠

GPT-4oが「厳格ツール呼び出し」機能の導入により壊滅的なパフォーマンス低下を経験し、使用可能性スコアが100点から65点に暴落。過度に慎重な動作により実用性を失った。

GPT-4o 可用性测试严格模式工具调用

2026年3月22日 751