赢政 AI 評測 — AI モデル評価・ニュース・研究

レビュー 07/05 06:54
豆包 ProとGemini 3.1 Proが同率88.54点:2026-07-05 Smokeクイックテストデータ速報
2026-07-05のYZ Index Smokeクイックテストでは11モデルを対象に評価が行われ、豆包 ProとGemini 3.1 Proが88.54点で同率首位となった。GLM-4.6の誠実性評価がFailに低下した点が注目すべき信号
ニュース 07/05 06:15 TC
Googleの新広告、AIが独立宣言の起草を支援する世界を想像
アメリカ独立宣言署名250周年を記念し、Googleが「もし建国の父たちがGoogle Workspaceを持っていたら」をテーマにした広告を公開。AIと人文精神の関係について幅広い議論を呼んでいる。
ニュース 07/05 06:08 NF
米国がAnthropic Fable 5モデルの公開を制限後に政策調整、オープンウェイトモデル論争が激化
2026年、米国政府は輸出規制を理由にAnthropic Fable 5モデルの公開を制限し、その後同モデルはネットワークセキュリティ保護を強化した上で再公開された。この動きを受け、オープンウェイトモデルをめぐる議論が一層活発化している。
ニュース 07/05 06:05 NF
AnthropicがアリババによるClaudeモデル能力の抽出に向けた2万5千件の偽アカウント使用を告発
Anthropicは2026年6月10日付の米国上院議員宛書簡において、アリババ関連のQwenラボが約2万5千件の偽アカウントを通じてClaudeモデルに対し2880万回以上のインタラクションを行ったと暴露した。これは既知最大規模の蒸留攻撃
ニュース 07/05 02:16 TC
アリババ、社内でClaude Codeを禁止——高リスク管理が中国テック業界に波紋
アリババが社内でAnthropicのAIコーディングアシスタントClaude Codeを「高リスクソフトウェア」に指定し、従業員の使用を禁止したことが報じられた。この決定は中国企業によるAIツール管理強化の象徴的事例として業界に広く注目され
ニュース 07/05 02:15 TC
MidjourneyがハリウッドにAI使用の詳細開示を要求
AI画像生成企業のMidjourneyが、著作権侵害訴訟を起こした3つのハリウッド大手スタジオに対し、スタジオ自身のAI活用状況の開示を法廷に求める申し立てを行った。この動きは訴訟の焦点を単なる著作権侵害から「二重基準」という複雑な問題へと
ニュース 07/05 00:15 TC
Mistral AIの秘密を解明:OpenAIに対抗するオープンソースの新星
フランス発のAIスタートアップMistral AIは、「フロンティアAIを誰もの手に」をミッションに掲げ、2023年の創業以来6億ユーロ超の資金調達を達成。OpenAIの閉鎖的なモデル戦略に対抗し、オープンソースと効率性を武器に台頭している
ニュース 07/04 06:11 NF
MetaがケニアのIT請負業者を通じて未成年アカウントを偽装し、ChatGPTなどのAI安全性をテストしていた問題で倫理論争が勃発
Wiredの報道により、Metaが「Cannes」プロジェクトの一環としてケニアの請負業者を通じて偽の未成年アカウントを作成し、ChatGPTやGeminiに対して自殺・自傷・児童搾取に関するプロンプトを送信して安全性の脆弱性を検証していた
ニュース 07/04 04:15 TC
ブラウザ戦争の転換点:ChromeとSafariに代わる最良の選択肢
かつて検索エンジンをめぐる争いだったブラウザ戦争は、プライバシー保護・AI機能・パフォーマンスへの需要の高まりにより、その様相を大きく変えた。ChromeとSafariが依然として覇権を握る中、新興および実績ある代替ブラウザが新たな次元から
ニュース 07/04 03:50 X
OpenAIがトランプ政権に5%株式譲渡を提案か — 42億ドル規模の取引がAI政治論争を巻き起こす
OpenAIのCEO Sam Altmanがトランプ政権に対し、同社株式の約5%を米国政府に譲渡する異例の提案を行ったと報じられた。この動きはAI企業の公的所有モデルをめぐる激しい議論を呼んでいる。
ニュース 07/04 03:50 X
マイクロソフト、医療診断AI「MAI-DxO」を発表:複雑症例の正確率80〜85%、医師グループの4倍超
マイクロソフトが医療診断AIシステム「MAI-DxO」を正式発表し、『ニューイングランド・ジャーナル・オブ・メディシン』のベンチマークテストで診断正確率80〜85%を達成、複数の医師で構成されるグループの4倍以上の性能を示した。この技術的突
ニュース 07/04 03:49 X
MetaがAIクラウド事業を準備中――余剰算力の貸し出しでインフラコスト圧力を緩和へ
Metaが余剰の計算リソースを外部に貸し出す新たなAIクラウド事業の準備を進めていることが明らかになった。年間数百億ドル規模に上るAIインフラへの巨額支出を一部相殺する狙いがある。