赢政 AI 評測 — AI モデル評価・ニュース・研究

レビュー 07/05 09:22
GLM-4.6、資料制約25点・コード実行88.7点・誠実性プローブがゼロ
GLM-4.6は2026-07-05 Run#214のSmokeクイックテストにおいて、コード実行で88.70点を記録した一方、資料制約は25.00点にとどまり、誠実性評価はfailと判定された。同日テストされた11モデルの中で、誠実性プロ
レビュー 07/05 06:54
豆包 Pro と Gemini 3.1 Pro が88.54点で並列首位:2026-07-05 Smokeクイックテストデータ速報
2026-07-05のYZ Index Smokeクイックテストでは11モデルを対象に評価を実施し、豆包 Pro と Gemini 3.1 Pro が88.54点で当日首位に並んだ。
ニュース 07/05 06:05 NF
AnthropicがアリババによるClaudeモデル能力の抽出に向けた2万5千件の偽アカウント使用を告発
Anthropicは2026年6月10日付の米国上院議員宛書簡において、アリババ関連のQwenラボが約2万5千件の偽アカウントを通じてClaudeモデルに対し2880万回以上のインタラクションを行ったと暴露した。これは既知最大規模の蒸留攻撃
ニュース 07/05 02:16 TC
アリババ、社内でClaude Codeを禁止——高リスク管理が中国テック業界に波紋
アリババが社内でAnthropicのAIコーディングアシスタントClaude Codeを「高リスクソフトウェア」に指定し、従業員の使用を禁止したことが報じられた。この決定は中国企業によるAIツール管理強化の象徴的事例として業界に広く注目され
ニュース 07/05 02:15 TC
MidjourneyがハリウッドにAI使用の詳細開示を要求
AI画像生成企業のMidjourneyが、著作権侵害訴訟を起こした3つのハリウッド大手スタジオに対し、スタジオ自身のAI活用状況の開示を法廷に求める申し立てを行った。この動きは訴訟の焦点を単なる著作権侵害から「二重基準」という複雑な問題へと
ニュース 07/05 00:15 TC
Mistral AIの秘密を解明:OpenAIに対抗するオープンソースの新星
フランス発のAIスタートアップMistral AIは、「フロンティアAIを誰もの手に」をミッションに掲げ、2023年の創業以来6億ユーロ超の資金調達を達成。OpenAIの閉鎖的なモデル戦略に対抗し、オープンソースと効率性を武器に台頭している
ニュース 07/04 06:15 TC
今年はこの一冊だけでOK!AI用語ガイド
TechCrunchのベテラン記者5名が共同で作成した年間AI用語ガイド。基礎から最前線まで、必須のAI専門用語とその定義を網羅している。
ニュース 07/04 06:11 NF
MetaがケニアのIT請負業者を通じて未成年アカウントを偽装し、ChatGPTなどのAI安全性をテストしていた問題で倫理論争が勃発
Wiredの報道により、Metaが「Cannes」プロジェクトの一環としてケニアの請負業者を通じて偽の未成年アカウントを作成し、ChatGPTやGeminiに対して自殺・自傷・児童搾取に関するプロンプトを送信して安全性の脆弱性を検証していた
ニュース 07/04 04:15 TC
ブラウザ戦争の転換点:ChromeとSafariに代わる最良の選択肢
かつて検索エンジンをめぐる争いだったブラウザ戦争は、プライバシー保護・AI機能・パフォーマンスへの需要の高まりにより、その様相を大きく変えた。ChromeとSafariが依然として覇権を握る中、新興および実績ある代替ブラウザが新たな次元から
ニュース 07/04 03:50 X
OpenAIがトランプ政権に5%株式譲渡を提案か — 42億ドル規模の取引がAI政治論争を巻き起こす
OpenAIのCEO Sam Altmanがトランプ政権に対し、同社株式の約5%を米国政府に譲渡する異例の提案を行ったと報じられた。この動きはAI企業の公的所有モデルをめぐる激しい議論を呼んでいる。
ニュース 07/04 03:50 X
マイクロソフト、医療診断AI「MAI-DxO」を発表:複雑症例の正確率80〜85%、医師グループの4倍超
マイクロソフトが医療診断AIシステム「MAI-DxO」を正式発表し、『ニューイングランド・ジャーナル・オブ・メディシン』のベンチマークテストで診断正確率80〜85%を達成、複数の医師で構成されるグループの4倍以上の性能を示した。この技術的突
ニュース 07/04 03:49 X
MetaがAIクラウド事業を準備中――余剰算力の貸し出しでインフラコスト圧力を緩和へ
Metaが余剰の計算リソースを外部に貸し出す新たなAIクラウド事業の準備を進めていることが明らかになった。年間数百億ドル規模に上るAIインフラへの巨額支出を一部相殺する狙いがある。