ArXiv新規定:AIで論文を全執筆すれば1年間アカウント停止
著名なプレプリントリポジトリArXivは、AIに研究作業全体を依存して論文を作成した著者に対し、1年間の投稿禁止という厳格な処罰を科す新方針を発表した。この措置は、学術界におけるAI乱用への懸念の高まりを反映している。
Winzheng動的コンテキスト減衰(WDCD)ベンチマーク Run #120では、11モデルの平均コミットメント減衰率が35.2%に達し、GPT-5.5が-13%の減衰率でトップを獲得しました。指示減衰が現在のフロンティアシステムにおける構造的な弱点であることが改めて示されました。
続きを読む著名なプレプリントリポジトリArXivは、AIに研究作業全体を依存して論文を作成した著者に対し、1年間の投稿禁止という厳格な処罰を科す新方針を発表した。この措置は、学術界におけるAI乱用への懸念の高まりを反映している。
Claude Sonnet 4.6が本日のSmoke簡易テストで顕著な異常を示し、メインランキング全体で12.3点下落した。中でも素材制約次元が27.3点という大幅な下落を記録し、Anthropicによる最近のアラインメント微調整との関連が注目される。
Claude Opus 4.7が本日のSmoke評価でメインランキング97.75点から88.75点へ9点下落し、材料制約次元が95点から75点へ急落しました。単日のサンプル偏差の可能性が高いものの、Anthropicの最近のコンテキスト最適化パッチとの関連も考慮する必要があります。
今週7日連続のSmoke簡易テストで、文心一言4.5が+53.4のトレンドで急騰し最大のダークホースとなった一方、GPT-o3は-7.8で主要モデル中最大の下落を記録した。
本日のSmoke軽量評価で、Claude Opus 4.7、DeepSeek V4 Pro、Qwen3 Maxの3モデルが88.75点で同率首位となった一方、Claudeシリーズは大幅下落し、DeepSeekとGrokが急上昇するなど、ランキングが大きく変動した。
OpenAI共同創業者のGreg Brockmanが全社的な製品戦略の策定と実行を正式に引き継ぎ、同時に主力製品であるChatGPTとCodexの技術スタックおよびユーザー体験面での統合が内部で検討されている。
米国商品先物取引委員会(CFTC)はAIを活用して予測市場におけるインサイダー取引の取り締まりを開始する。機械学習モデルで異常取引パターンを検出する計画だが、プライバシーや法的定義の課題も浮上している。
アセクシュアル(無性愛者)の人々がAIチャットボットを通じて性行為を伴わない親密さを探求する現象が広がっているが、そのコミュニティ内部では身分認同を巡る賛否両論が起きている。
世界的注目を集めるマスク対OpenAI訴訟が最終週を迎え、双方の弁護士はイーロン・マスクとサム・アルトマンの個人的信頼性を直接攻撃する戦略に転じた。この「信頼を巡る戦い」の結果が、陪審員の判断を左右することになる。
NTEゲーム開発チームは5月15日、将来的にコアアセットとキャラクター描画にAI技術を採用しないことを明言し、品質と評判を優先する方針を示した。X(旧Twitter)プラットフォーム上では支持と反対の意見が対立している。
NVIDIAが5月15日に発表した2.6Bパラメータのオープンソース世界モデルは、単一GPUで動作し、軌跡制御により単一画像から動的世界を生成可能。AI研究の民主化を加速する一方、虚偽コンテンツ生成への悪用懸念も浮上している。
Anthropicが5月14日に発表した新論文で米国政府に対中AI政策の強硬化を促し、かつての「安全ラボ」としての立場から大きく転換した。execution(コード実行)とgrounding(材料制約)の観点から、この戦略変更の深層的な技術的動機を分析する。