Claude 3.5 Sonnet、SWE-benchのコーディング基準で首位に:72.7%のスコアでAIプログラミング分野をリード
AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで72.7%という驚異的なスコアを記録し、初めてAIのコーディング能力を70%以上に押し上げ、プログラミング分野で最強のAIとなった。
AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで72.7%という驚異的なスコアを記録し、初めてAIのコーディング能力を70%以上に押し上げ、プログラミング分野で最強のAIとなった。
AnthropicのClaude 3.5 Sonnetがソフトウェアエンジニアリングベンチマークテスト「SWE-bench」で49%の正確率を達成し、GPT-4o(33.2%)を大きく上回った。この技術的ブレークスルーはX上で数万回シェアさ