オリジナル Claude 3.5 Sonnet、SWE-bench基準でリードし、コード生成能力がGPT-4oを超える Claude 3.5 SonnetがSWE-bench基準テストでGPT-4oを超える成果を上げ、AIコード生成分野で注目を集めています。強化学習を活用したこのモデルは、開発者にとってより信頼性の高いプログラミングアシスタントとしての地位を Claude 3.5 Sonnet 代码生成 Anthropic SWE-bench 2026年2月2日 461