DeepSeek-V2オープンソースモデルが重大発表:236Bパラメータ MoEアーキテクチャがGPT-4oに匹敵、推論コストはわずか1/30
中国のAIスタートアップDeepSeekが新世代オープンソース大規模言語モデルDeepSeek-V2を発表。236億パラメータのMoEアーキテクチャでGPT-4oに匹敵する性能を実現しながら、推論コストを30分の1に削減した。
中国のAIスタートアップDeepSeekが新世代オープンソース大規模言語モデルDeepSeek-V2を発表。236億パラメータのMoEアーキテクチャでGPT-4oに匹敵する性能を実現しながら、推論コストを30分の1に削減した。
中国AIスタートアップDeepSeekが最新の開源大規模言語モデルDeepSeek V2を発表。推論コストはGPT-4oの1/30で、Hugging Faceプラットフォームで急速に人気ランキングトップに躍進した。
OpenAIが最近発表したSoraの新しい動画デモは、AI動画生成の技術的上限を再び更新した。このデモは、テキストプロンプトから最大1分間の高画質動画を生成でき、物理的リアリティとシーンの複雑さは驚嘆に値する。
MetaがLlama 3.1シリーズの大規模言語モデルを発表し、405Bパラメータのフラッグシップ版を完全オープンソースで公開。初日で100万ダウンロードを突破し、オープンソースAI分野の重大な突破として称賛されている。
AnthropicのClaude 3.5 Sonnetがソフトウェア工学ベンチマークSWE-benchで90%以上のスコアを達成し、AIコーディング能力の新時代到来を示した。この成果は複数の記録を更新し、開発者コミュニティで広範な議論とプロ
DeepSeekチームが発表したV2版オープンソース大規模モデルが、複数の中国語ベンチマークテストで優れた性能を示し、特に数学とコード生成タスクでMetaのLlama3を上回った。訓練コストはLlama3の1/10という驚異的な効率性で、中
AI新興企業AnthropicがClaude 3.5 Sonnetモデルを発表し、コーディングと視覚理解タスクでGPT-4oを上回る性能を示し、推論速度を2倍に向上させてLMSYS Chatbot Arenaランキング首位を獲得した。
快手科技はKling AIの1.5バージョンを発表し、1080pの高画質ビデオ生成が可能となり、最長2分の動画が作成できるようになりました。この新機能はOpenAIのSoraモデルと比較されるほどの動的な一貫性を持ち、AI動画生成ツールの普