赢政 AI 評測 — AI モデル評価・ニュース・研究

ニュース 05/27 04:55 Winzheng Lab
WDCD Run #135:Qwen3 Maxが指示減衰わずか10%でトップ、全体平均は43.3%に
WinzhengのWDCDベンチマークRun #135では、11モデルのマルチターン対話における指示維持能力を評価し、Qwen3 Maxが–10%の最小減衰で首位を獲得した一方、全体平均は43.3%の減衰を記録した。
ニュース 05/27 04:01 TC
AIモデルアグリゲーションプラットフォームOpenRouter、評価額13億ドル突破
AIモデルアグリゲーションプラットフォームOpenRouterが1.13億ドルのシリーズB資金調達を完了し、評価額が13億ドルに達した。マルチモデル協調の需要急増を背景に、半年で利用量が5倍に成長している。
ニュース 05/27 04:00 ARS
オープンソースパッケージStarletteに「BadHost」脆弱性発見、数百万のAIエージェントが危機に
Python製オープンソースフレームワークStarletteに高危険度の「BadHost」脆弱性が発見され、これに依存する数百万のAIエージェント、APIサービス、Webアプリケーションが影響を受けている。攻撃者はHostヘッダーを偽造する
ニュース 05/27 02:02 TC
インドのギグエコノミー:世界中のロボットを訓練する新たな分野となるか?
米国の研究者が設立したスタートアップHuman Archiveが、インドのギグワーカーにカメラやセンサーを装着させ、ロボット訓練用の実世界の物理動作データを収集する革新的なモデルを推進している。低コストで多様な実データを得る一方、プライバシ
ニュース 05/27 02:01 ARS
3Dプリント人型ロボット脚:2500ドルで実験を自由に走らせる
Hugging Faceが2500ドルの二足歩行ロボットプロジェクト「Bipod」を発表。3Dプリントによる人型脚部構造を採用し、完全オープンソースで提供することで、ロボット研究の敷居を大幅に下げることを目指す。
ニュース 05/27 02:00 ARS
FBI捜査官:AIポルノアカウントの追跡はこんなにも簡単
米FBI捜査官が法廷証言で、Instagramに保存された1つの投稿だけを手がかりに、同意なきAIポルノ動画の制作・拡散容疑者を特定した経緯を詳述。デジタル時代におけるプライバシー危機とAI悪用への懸念が広がっている。
ニュース 05/27 00:02 TC
TechCrunch Disrupt 2026早割チケット5月29日締切、最大410ドル割引
TechCrunch Disrupt 2026の早割チケットが太平洋時間5月29日23:59に締切を迎え、その後はチケット価格が最大410ドル値上げされる。スタートアップ、投資家、技術関係者にとって、この数日間が最もコストパフォーマンスの高
ニュース 05/27 00:01 MIT
AIエージェント時代、組織設計の再構築が急務
AIエージェント(Agentic AI)が企業向けアプリケーションに急速に浸透する中、85%の組織がエージェント駆動型運営への移行を望むものの、76%が現状のプロセスやインフラでは支えきれないと認めている。技術導入よりも組織設計の再構築が真
ニュース 05/27 00:00 TC
ユニバーサルミュージックがTikTokと契約更新、AIによる音楽著作権侵害に共同で対抗
ユニバーサルミュージックグループとTikTokが契約更新を発表し、無許可のAI生成音楽への対策を重点課題として明確化。AIコンテンツ識別システムの強化やデジタル透かしの導入など、具体的な対応条項が盛り込まれた。
ニュース 05/26 22:01 WD
AIのファクトチェック誤り率は想像以上に高い
WIREDの専門ファクトチェッカーMeghan Herbstは実験により、AIによるファクトチェックの誤り率が一般認知よりはるかに高いことを発見した。AIは出所や引用を捏造するだけでなく、単純な統計数字でも系統的な偏りを示す。
ニュース 05/26 22:00 MIT
AI雇用恐慌を打ち破る:現実検証と技術不安
MIT Technology Reviewの最新報道は、AIが大規模にホワイトカラーの職を奪うという論調に対し、実証データに基づく冷静な分析を提示している。本記事では、データの真相、構造的不安、歴史的教訓を踏まえ、AI脅威論への理性的アプロ
ニュース 05/26 20:05 AIN
自律型AIシステムが物理世界で既存のガバナンスフレームワークに挑戦
自律型AIシステムが物理世界に進出するにつれ、既存のAIガバナンスフレームワークの限界が浮き彫りとなり、新たな「具身化」された規制アプローチが求められている。