Claude 3.5 Sonnet、コーディングテストSWE-benchで90%超を達成、AI プログラミング能力が人間レベルへ
AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで90%以上のスコアを達成し、AIコーディング能力の新時代到来を示した。この成果は複数の記録を更新し、開発者コミュニティで広範な議論とプロ
AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで90%以上のスコアを達成し、AIコーディング能力の新時代到来を示した。この成果は複数の記録を更新し、開発者コミュニティで広範な議論とプロ
AI新興企業AnthropicがClaude 3.5 Sonnetモデルを発表し、コーディングと視覚理解タスクでGPT-4oを上回る性能を示し、推論速度を2倍に向上させてLMSYS Chatbot Arenaランキング首位を獲得した。
2026年、AnthropicのClaude Codeがプログラミングの新しいパラダイムを導き、創設者のBoris Chernyがその作業フローをXプラットフォームで共有しました。この発表は開発者コミュニティで大きな反響を呼び、AI時代のソ
Anthropicは新しいAIエージェント「Cowork」を発表しました。これはClaude Desktopに基づき、プログラミングなしでユーザーのファイルシステムで操作が可能です。AIエージェント技術が一般ユーザーへと拡大する重要なステッ
AIコーディングツールClaude Codeの高額な料金設定が開発者の不満を招き、Block社が開発した無料のオープンソース代替品Gooseの人気が急上昇しています。開発者コミュニティでは、GooseがClaude Codeに匹敵する機能を
Google Vertex AIのエラーログがリークし、Anthropicの次世代AIモデルClaude Sonnet 5の詳細が明らかになりました。このモデルは「Fennec」というコードネームを持ち、前モデルを大きく上回る性能と競争力の
Anthropic社のClaude 3.5 Sonnetモデルが、SWE-benchというソフトウェア工学の基準テストで49%のタスク解決率を達成し、OpenAIのGPT-4oを大きく上回った。この結果は、コード生成AIの性能記録を更新し、
AnthropicのClaude 3.5 SonnetがSWE-benchで49%の正確率を記録し、GPT-4oを超える成果を上げました。これにより、開発者の生産性向上が期待され、AIが新たな革命を引き起こしています。
AnthropicはClaude 3.5 Sonnetモデルを発表し、このモデルはSWE-bench Verified基準テストで49%のスコアを達成し、OpenAIのGPT-4oを約20%リードしました。このニュースは開発者コミュニティで
Claude 3.5 SonnetがSWE-bench基準テストでGPT-4oを超える成果を上げ、AIコード生成分野で注目を集めています。強化学習を活用したこのモデルは、開発者にとってより信頼性の高いプログラミングアシスタントとしての地位を