编程AI に関するニュース

Claude 3.5 Sonnet、SWE-benchのコーディング基準で首位に：72.7%のスコアでAIプログラミング分野をリード

AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで72.7%という驚異的なスコアを記録し、初めてAIのコーディング能力を70%以上に押し上げ、プログラミング分野で最強のAIとなった。

AnthropicのClaude 3.5 Sonnetがソフトウェアエンジニアリングベンチマークテスト「SWE-bench」で49%の正確率を達成し、GPT-4o（33.2%）を大きく上回った。この技術的ブレークスルーはX上で数万回シェアさ