Claude 3.5 Sonnet、コーディングテストSWE-benchで90%超を達成、AI プログラミング能力が人間レベルへ
AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで90%以上のスコアを達成し、AIコーディング能力の新時代到来を示した。この成果は複数の記録を更新し、開発者コミュニティで広範な議論とプロ
AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで90%以上のスコアを達成し、AIコーディング能力の新時代到来を示した。この成果は複数の記録を更新し、開発者コミュニティで広範な議論とプロ
Anthropic社のClaude 3.5 Sonnetモデルが、SWE-benchというソフトウェア工学の基準テストで49%のタスク解決率を達成し、OpenAIのGPT-4oを大きく上回った。この結果は、コード生成AIの性能記録を更新し、
AnthropicのClaude 3.5 SonnetがSWE-benchで49%の正確率を記録し、GPT-4oを超える成果を上げました。これにより、開発者の生産性向上が期待され、AIが新たな革命を引き起こしています。