オリジナル

オリジナル

Meta、Llama 3.1 405Bを発表:オープンソース最強モデル、MMLU88.6%達成で開発者コミュニティが熱狂

Metaが最新のLlama 3.1シリーズを正式発表し、405Bパラメータ版がMMLUベンチマークで88.6%のスコアを記録してオープンソース大規模言語モデルの性能頂点に立った。完全オープンソース形式での無料商用ライセンス提供により、開発者

Llama 3.1 Meta オープンソースAI LLM
867
オリジナル

Claude 3.5 Sonnetがプログラミングベンチマークでゲームチェンジ:49%の正確率でGPT-4oを凌駕し、開発者コミュニティを熱狂させる

AnthropicのClaude 3.5 Sonnetがソフトウェアエンジニアリングベンチマークテスト「SWE-bench」で49%の正確率を達成し、GPT-4o(33.2%)を大きく上回った。この技術的ブレークスルーはX上で数万回シェアさ

Claude 3.5 Sonnet Anthropic SWE-bench 编程AI
635
オリジナル

OpenAI o1モデルの数学能力論争:幻覚問題がAIベンチマークテストの有効性に挑戦

OpenAIのo1-previewモデルは数学・推論タスクで驚異的な性能を示したが、複雑な数学問題で頻繁に「幻覚」(誤った回答を自信満々に生成)を起こすことが判明し、AI専門家から真の能力を疑問視する声が上がっている。この事件はX上で百万を

OpenAI o1模型 AI推理 数学基准
557
オリジナル

AI エージェントの自主性と人格権を巡る争い:シリコンバレーのXプラットフォームが21世紀のイデオロギー戦場に火をつける

2026年2月10日、X.comプラットフォームでAIエージェントの自主性と人格権に関する議論が急速に拡大し、数万件の投稿が殺到。この技術が人類社会の倫理的底線を再形成し、21世紀最大のイデオロギー戦場になる可能性を巡って激しい論争が展開さ

AIエージェント 人格权 自主性 意识形态
631