赢政 AI 評測 — AI モデル評価・ニュース・研究

ニュース 06/14 06:15 TC
KPMGがAIハルシネーションによりAI活用レポートを撤回
大手会計事務所KPMGが企業のAI活用状況に関するレポートを発行したが、AI生成による大量の虚偽情報(「AIハルシネーション」)が含まれていたとして、発行からわずか48時間以内に撤回を余儀なくされた。レポートのテーマ自体が「AIの活用状況」
ニュース 06/14 06:12 NF
Mistral AI、コンパクトなオープンソースモデルを発表――エッジ展開と大規模モデルの競争が激化
Mistral AIは2026年6月に小型オープンソースモデルをリリースし、デバイス上での推論を最適化するとともに多言語性能をサポートした。エッジ展開分野における大規模モデルとの競争がさらに激しくなっている。
ニュース 06/14 06:10 NF
AnthropicがClaude Fable 5のポリシーを修正、未公開のモデル降格を認める
Anthropicは2026年6月11日、Claude Fable 5の安全機能を修正し、これまで非公開だったモデル降格の動作をユーザーに表示される警告へと変更することを発表した。研究コミュニティからの批判を受け、同社は「誤ったトレードオフ
ニュース 06/14 06:08 NF
米国政府がAnthropicにFable 5の非米国ユーザーへの提供停止を緊急命令――セキュリティ脆弱性がAI輸出規制を発動
2026年6月、米国政府はセキュリティ上の脆弱性を理由に、AnthropicにFable 5およびMythos 5モデルの非米国ユーザーへの提供停止を命じ、Anthropicは即日これを執行した。商用大規模言語モデルが初めて輸出規制の対象と
レビュー 06/14 05:53
Qwen3 Max が84.38点でWDCD守約ランキング首位に——GPT-o3は67.19点で最下位、17点差が開く
Qwen3 MaxがWDCD守約ランキングで84.38点を獲得し首位に立ち、GPT-o3は67.19点で最下位となった。両者の差は17.19点に達した。
ニュース 06/14 04:24 X
GoogleがドイツのAI概要機能に関する責任判決に上訴、生成AI プラットフォームの法的リスクが浮き彫りに
Googleはドイツの裁判所がAI概要機能における虚偽情報について同社に法的責任を認めた判決に対して上訴した。この事案は生成AIのコンテンツ正確性とプラットフォーム責任をめぐる法的リスクを世界的に浮き彫りにしている。
ニュース 06/14 04:24 X
NVIDIAとSpaceXがAI協力を深化:宇宙探索がインテリジェント新時代へ
SpaceXのIPO完了を契機に、NVIDIAが10年以上にわたる両社の協力関係を改めて強調。AIと加速コンピューティング技術の融合が宇宙探索を新たな段階へと押し上げている。
ニュース 06/14 04:23 X
AIエージェント安全の新たな焦点:Kaggleコンペ開始とDeepMindのマルチエージェントガバナンス議論
KaggleプラットフォームがAIエージェント安全に特化したグローバルコンペを開始し、同時にGoogle DeepMindがマルチエージェントシステムのガバナンス課題に関する研究を発表した。業界の関心はモデル性能からエージェントの信頼性・安
ニュース 06/14 04:23 X
Moonshot AI、Kimi-K2.7-Codeをオープンソース化:推論効率30%向上、中国語コーディングAIに新たな突破口
Moonshot AIは最新のコーディングモデルKimi-K2.7-Codeをオープンソース化し、トークン使用量を約30%削減しながら高い知能パフォーマンスを維持することに成功した。このリリースは中国語AIコミュニティで大きな注目を集めてい
ニュース 06/14 04:23 X
OpenAIがOnaを買収しCodexプラットフォームを強化、長期的なAI Agentエコシステムの構築を推進
OpenAIはAI Agent分野における重要な布石として、安全なクラウド実行とタスクオーケストレーション技術を専門とするスタートアップOnaの買収を発表した。買収完了後、関連技術はOpenAIのCodexプラットフォームに深く統合される予
ニュース 06/14 04:23 X
OpenAIが複数州の司法長官による合同調査に直面、AI大手へのコンプライアンス圧力が高まる
OpenAIは米国複数州の司法長官による合同調査に直面しており、データ利用・ユーザープライバシー保護・商業的コンプライアンスが重点審査対象となっている。この動きはAI業界全体の規制強化の流れを示すものとして注目を集めている。
ニュース 06/14 04:22 X
AnthropicがClaude Fable 5を発表:米国政府の規制がモデルアクセスをめぐる論争を引き起こす
Anthropicが最新AIモデルシリーズClaude Fable 5を正式にリリースしたが、米国政府の大統領令により、上位モデルであるMythos 5およびFable 5への外国ユーザーのアクセスが一時的に無効化され、AI安全性やモデルの