DeepSeek-V2リリース:中国語推論能力でトップランナーに、236Bオープンソースモデルが世界のAI構図に挑戦
中国のAIスタートアップDeepSeekが最新の大規模言語モデルDeepSeek-V2を正式リリースし、中国語の数学推論とコード生成能力でAnthropic社のClaude 3.5 Sonnetを大幅に上回り、これらの分野で世界初のリーディ
中国のAIスタートアップDeepSeekが最新の大規模言語モデルDeepSeek-V2を正式リリースし、中国語の数学推論とコード生成能力でAnthropic社のClaude 3.5 Sonnetを大幅に上回り、これらの分野で世界初のリーディ
NVIDIAが70億パラメータの音声対話専用AIモデル「PersonaPlex-7B」をオープンソース公開。リアルタイムで割り込み可能な自然な対話を実現し、従来の「交互発話型」AI対話の限界を打破。
中国AIスタートアップDeepSeekが最新の開源大規模言語モデルDeepSeek V2を発表。推論コストはGPT-4oの1/30で、Hugging Faceプラットフォームで急速に人気ランキングトップに躍進した。
アリババクラウドの通義千問チームが発表したQwen2.5-Maxモデルが、権威ある中国語MMLU基準テストで86.1%のスコアを記録し、OpenAIのGPT-4o(85.8%)を超えて中国語大規模モデルの首位に躍り出た。この躍進により24時
アリババクラウドが数百億パラメータ規模の大規模言語モデルQwen2.5-Maxを発表し、数学推論とコーディング能力でGoogleのGemini 1.5 Proを上回る性能を示した。オープンソース・無料戦略により中国AIコミュニティで大きな注
MetaがLlama 3.1シリーズの大規模言語モデルを発表し、405Bパラメータのフラッグシップ版を完全オープンソースで公開。初日で100万ダウンロードを突破し、オープンソースAI分野の重大な突破として称賛されている。
DeepSeekチームが発表したV2版オープンソース大規模モデルが、複数の中国語ベンチマークテストで優れた性能を示し、特に数学とコード生成タスクでMetaのLlama3を上回った。訓練コストはLlama3の1/10という驚異的な効率性で、中
中国のAIスタートアップ企業DeepSeekが最新の大規模言語モデルDeepSeek-V2を発表しました。このモデルは、中国語の数学推論ベンチマークでOpenAIのGPT-4oを超える性能を示し、ユニークなMoEアーキテクチャを使用して効率