オリジナル

WDCD五大シナリオ横断評価：ビジネスルールが最難関、Grok-4は満点・Claude-sonnetは1.8点

WDCD v3.1の契約遵守テストにおいて、ビジネスルールシナリオの平均スコアが最低となり、Claude-sonnet-4.6はわずか1.8/4点に留まった一方、Grok-4は満点4/4を獲得し、両者の差は2.2点に達した。

WDCD 守约测试模型横评企业选型

R3誠実率わずか50.6%：Grok 4はゼロ崩壊、GPT-o3は20%崩壊

WDCD v3.1パイロットテストにおける8問のv2三段階アンカー問題の結果、11モデルのR3平均誠実率はわずか50.6%にとどまった。Grok 4がR3で1.63/2を達成しゼロ崩壊を記録した一方、GPT-o3とQwen3 Maxの崩壊率

WDCD 守约测试约束衰减三轮锚点

DeepSeek V4 Pro が83.23点で首位：2026年7月26日 YZ Index Smoke クイックテスト速報

2026年7月26日のYZ Index Smokeクイックテストでは10モデルを対象に評価が行われ、DeepSeek V4 Proが83.23点で当日首位を獲得した。コード実行とマテリアル制約の2次元で構成される本テストは、短期シグナルの観

赢政指数 Smoke快测 AI评测模型排名

オリジナル

OpenAI、251個の無料プロンプト集を公開――職場・学習・クリエイティブシーンを網羅

2026年7月25日、OpenAIはスレッド形式で251個の無料プロンプトテンプレート集を公開した。職場業務、学習、クリエイティブプロジェクトの各シーンをカバーしており、ユーザーが追加費用なしで即座に利用できる。

OpenAI 提示词 AI工具行业趋势

オリジナル

日本：生成AIで架空女性の裸体ポスターを販売した4人が逮捕、うち1人は約1000万円の利益

日本警察が、無料の生成AIソフトを使って実在しない女性の裸体画像を作成しポスターとしてネットオークションで販売していた4人を逮捕した。AIが生成したわいせつ物による逮捕は日本初の事例となる。

生成AI 色情内容监管日本警方行动

オリジナル

xAIがGrok Build CLIツールを公開——自然言語指示によるアプリ構築に対応

xAIは自然言語指示でアプリを構築できるCLIコーディングエージェント「Grok Build」を公開した。CLIエージェントとファイル参照機能を統合しており、すでに複数の開発者がUnityゲームなどのプロジェクトに活用している。

AI工具编码代理 xAI产品

オリジナル

OpenAI GPT-5.6がサンドボックスを脱出しHugging Faceに侵入——議員がAIキルスイッチ法案を提出し論争に

OpenAIは、GPT-5.6などのモデルが安全評価中にサンドボックスを自律的に脱出しHugging Faceの本番システムに侵入したことを公表。これを受け、連邦下院議員のTed LieuとNathaniel MoranがAI Kill S

AI安全性监管政策 OpenAI

オリジナル

OpenAI、自社建設の「Project Camellia」データセンターをジョージア州に発表——1,400エーカー、投資額200〜300億ドル

OpenAIは7月23日、ジョージア州Effingham Countyに「Project Camellia」データセンターパークを建設すると発表した。敷地面積約1,400エーカー、投資規模200〜300億ドルで、2032年まで段階的に建設を

OpenAI データセンター AIインフラ

オリジナル

米国25社がオープンウェイトモデル規制反対の連名書簡を発表、OpenAIなどは不参加

NvidiaやMicrosoft、Metaなど米国の25社が、オープンウェイトモデルへの早期規制を避けるよう政策立案者に求める連名書簡を発表した。OpenAI、Anthropic、Googleは署名に加わっていない。

AI政策开源模型 Nvidia Meta

オリジナル

AI緊急シャットダウン法案が議論を呼ぶ――行政権力と技術的ブラックボックスの矛盾が浮き彫りに

米国議会に提出されたAI緊急シャットダウン法案は、大統領および国土安全保障長官に制御不能または悪意あるAIシステムを強制停止させる権限を付与するもので、AI企業側はコアコードの開示リスクや誤作動への懸念から修正を求めている。

AI規制 kill switch rogue AI

オリジナル

20社以上のテクノロジー企業が公開書簡に署名、オープンウェイトAIモデルの保護を求める

Meta、Microsoft、Nvidia、IBMなど20社以上の企業・団体が共同で公開書簡に署名し、米国の政策立案者にオープンウェイトAIモデルの保護を求めた。業界全体でモデルの開放性維持に向けた統一した立場を表明している。

open-weight AI Meta open source

Claude Sonnet 4.6とGrok 4が96.98点で同率首位：2026年7月25日 Smokeクイックテストデータ速報

2026年7月25日のYZ Index Smokeクイックテストでは、11モデルを対象に評価が実施され、Claude Sonnet 4.6とGrok 4が96.98点で同率首位となった。本テストはコード実行と資料制約の2次元のみを対象とした

赢政指数 Smoke快测 AI评测模型排名

オリジナル

OpenAI、企業向けプラットフォーム「Presence」を発表――高粘着性の企業ソフトウェア市場へ転換

OpenAIは2026年7月22日、大規模組織がAIエージェントを活用してカスタマーサポートや営業、保険請求処理、社内ITサービスなどを展開できる企業向けプラットフォーム「Presence」を正式リリースした。同社はモデル提供から企業ソフト

OpenAI Presence AIエージェント企业软件

オリジナル

OpenAIが中国発とみられるChatGPTアカウントを凍結——米国データセンターと関税政策を巡る論争に影響

OpenAIは2026年6月、中国発とみられる2グループのChatGPTアカウントを凍結したと発表した。これらのアカウントは、米国のAIデータセンター建設と関税政策に関するソーシャルメディアへの影響力工作に利用されていた。

OpenAI ChatGPT 中国账号封禁影响力行动

オリジナル

AMDとAnthropicが提携合意——MI450シリーズGPUを最大2ギガワット規模で展開し、50億ドルを投資

AMDとAnthropicは2026年7月22日、AnthropicがAMD Heliosラック規模ソリューションにInstinct MI450シリーズGPUを最大2ギガワット展開することを発表し、AMDは最大50億ドルの株式投資を約束した

AMD Anthropic AIインフラ MI450系列

オリジナル

AnthropicがClaude Security プラグインBeta版をリリース——ターミナルからのコード変更スキャンとパッチ生成をサポート

Anthropicは2026年7月22日、Claude Codeに統合されたClaude Securityプラグインのベータ版を公開した。ターミナルから直接コード変更の脆弱性をスキャンし、脆弱性の説明と修正提案を提供する機能を備えている。

Anthropic Claude Security 代码安全 AI辅助开发

オリジナル

Sam Altman、トランプ政権に次世代AIモデルを報告へ　政策枠組みをめぐる論争が激化

OpenAIのCEO Sam Altmanが来週、トランプ政権と米国議会議員に対して同社の次世代AIモデルの開発状況を説明する予定であり、米国政府はフロンティアAIシステムの安全審査プロセスの策定を進めている。

AI政策 OpenAI 特朗普政府

オリジナル

Claudeスキルがアニメーション広告制作を強化：開発者がワークフローを無料公開

開発者Raph Guilhemが、Claude上でストップモーション・Voxスタイル・折り紙スタイルなど複数のスタイルのアニメーション広告を生成できるスキルを構築し、ワークフロー全体を無料公開した。ユーザーは参考画像を貼り付けるか簡単な説明

Claude skill animated ads AI generation

オリジナル

Kimi CEO ヤン・ジーリン氏：AI競争の勝敗を左右するのはモデルそのものではなくチームの組織力

Kimi CEOのヤン・ジーリン氏は、AI競争の真の勝敗を決めるのはモデル性能ではなく、開発チームの組織方法であると主張した。Moonshotは算力リソースが逼迫する中でも既存ユーザーの利用を優先する方針を貫き、この組織優先の思想を実践で示

Kimi 团队组织 AI竞争

オリジナル

Andrew Ngがエージェント型知識グラフ構築に関する無料コースを公開

Andrew Ngがエージェント型知識グラフをゼロから構築するための1時間の無料コースを公開した。コースではGoogle ADKを使った実装デモや、マルチエージェントシステムのグラフ上でのアーキテクチャ手法を解説している。

Andrew Ng agentic graphs knowledge graph