赢政研究院が初のハードウェア天梯図を発表：300元の中古スマホでDeepSeekが動作、1万元級RTX 4090は「庶民のフェラーリ」の称号を獲得

2026年2月14日 1,343 約7分嬴政天下

DeepSeek 硬件评测 RTX 4090 Apple M4 Max 小米8 A100 赢政研究院 AI天梯图本地推理大模型

赢政指数_DeepSeek最佳运行硬件排行榜_2026Q1.pdf PDF · 131.48 KB 下载完整报告

北京時間2026年2月13日 —— 大多数の人々がまだAI計算力が巨大テック企業の独占物かどうかを議論している中、赢政研究院からの独立評価レポートが、7年の技術世代差をまたぐ4台のデバイスを使って、業界を驚かせる答えを提示した。

『YZ Index・2026 Q1ハードウェア天梯図』と題されたこのレポートは、NVIDIA A100 80GB（データセンター級フラグシップ、クラウドレンタル価格は1時間2ドル）、NVIDIA RTX 4090（消費者向けグラフィックカードの王者、中国国内価格約13,000元）、Apple Mac M4 Max 128GB（価格約28,000元）、そして2018年発売で中古価格わずか300元のXiaomi 8を、同時にDeepSeekローカル推論の舞台に上げた。

これは通常の評価ではない。これは「AIは本当に一般人からどれほど遠いのか」についての極限テストだ。

4090：1万元で買える「クラウドサービス体験」

レポートの最も核心的な結論は、RTX 4090に属する。

DeepSeek-R1蒸留版14Bパラメータモデルを実行する際、この消費者向けグラフィックカードは毎秒58Tokenの生成速度を記録した——この数字は何を意味するのか？それは大多数の人の読書速度よりも速い。より大きな32Bパラメータモデルに切り替えても、4090は依然として毎秒34Tokenで安定しており、これは企業級H100の約75%の性能に相当し、コストは後者のわずか5分の1だ。

赢政研究院はレポートの中で、躊躇なく「庶民のフェラーリ」の称号をRTX 4090に授与した。理由は簡潔で力強い：1万元余りで、自宅にデータが完全にプライベートで、継続的な料金支払いが不要で、クラウドに匹敵する体験のAIワークステーションを所有できるからだ。

M4 Max：ノートパソコンだと思ったら、実は700億パラメータを実行している

4090がコストパフォーマンスで勝つとすれば、Apple M4 Maxは誰もが過小評価している次元——容量で勝っている。

Apple Siliconの統一メモリアーキテクチャのおかげで、128GBメモリを搭載したM4 MaxはDeepSeek-R1蒸留版70Bパラメータモデルの読み込みと実行に成功した。これは単体のRTX 4090では物理的に不可能なことだ——24GBのVRAMではモデルすら装填できないが、M4 Maxの128GB統一メモリはCPUとGPUが同じ巨大なメモリプールを共有し、40GBのモデルウェイトを軽々と収容した。

さらに印象的なのはエネルギー効率の表現だ。システム全体の消費電力はわずか40〜45ワットで、4090のフル稼働時の消費電力の約8分の1であり、ワット当たりのToken生成数は4090の約7倍に達した。レポートはこれを「沈黙のギーク」と呼んでいる——外見は普通のAppleノートパソコンだが、内部では700億パラメータの大規模言語モデルを静かに実行している。

Xiaomi 8：300元の「パフォーマンスアート」

しかし、レポート全体で最も意外な章は、あのXiaomi 8に属する。

Snapdragon 845プロセッサを搭載し、わずか6GBのRAMしか持たない2018年製のこのスマートフォンは、TermuxターミナルエミュレータとOllama推論フレームワークを通じて、DeepSeek-R1蒸留版1.5Bパラメータモデルの読み込みに成功し、毎秒3〜5Tokenの速度でテキストを出力した——ちょうど人間が読める限界の速度だ。

代償は明らかだ。継続的な推論を2分も行わないうちに、本体温度は45度以上に急上昇し、局所的なホットスポットは50度に迫った。プロセッサは熱によるスロットリングを開始し、生成速度は毎秒5Tokenから2〜3Tokenまで滑り落ちた。レポートには特に太字の警告が付けられている：「充電中または覆い物の下でのテストは行わないでください。『AI発烧友（AIフィーバー）』の文字通りの意味を体験したい場合を除いて。」

赢政研究院はこのテストを「パフォーマンスアート」と定義した——それは一つの可能性を証明した。つまり、わずか300元の中古スマートフォンでも確かに完全オフラインの状態でAI推論を実行できるが、実用にはまだ相当な距離がある。1.5Bパラメータの極小モデルは簡単な質疑応答やコード補完ができるが、複雑な推論や長文生成は力不足だ。

A100：議論の余地のない天井

対照群として登場したNVIDIA A100 80GBは、絶対性能において議論の余地なく首位を占めた。80GB HBM2eメモリと毎秒最大2TBのメモリ帯域幅により、量子化圧縮なしで32Bパラメータモデルをフル精度で読み込むことができる。デュアルカード構成で70Bモデルを実行する際、生成速度は毎秒約19Tokenで安定し、GPU使用率は約88%を維持した。

しかし、レポートのコメントは意味深長だ：「これは文字通りのフェラーリだ——良いが、高すぎる。」単体カードの購入コストは1万〜1万5千ドル、クラウドレンタルは1時間2ドルで、個人ユーザーにとってはほぼ実現不可能だ。

一つの表、四つの世界

レポートが最終的に発表した「赢政総合ランキング」は、速度、容量、エネルギー効率、使いやすさ、コストパフォーマンスの5つの次元で10点満点で採点した。RTX 4090が38点でコストパフォーマンス総合優勝、M4 Maxが41.5点で総合得点で実際に最高（主に容量とエネルギー効率で勝利）、A100が32点で3位、Xiaomi 8が14.5点で最下位——しかし特別に設けられた「最優秀勇気賞」を獲得した。

レポートは結語で次のように記している：

「私たちはAIの民主化時代に入りつつある。予算が300元であろうと3万元であろうと、誰もが自分のフェラーリを見つけることができる。違いは、本物のF40なのか、スケールモデルなのかだけだ——しかし、どちらもスピードと情熱を感じさせてくれる。」

これはおそらく2026年の年初以来、AI計算力の平等化に関する最も力強い注釈だろう。

Winzheng Research Labは、AIベンチマークテスト、モデルセキュリティ、ハードウェア最適化に特化した独立研究機関であり、100%独立かつ客観的な評価姿勢を堅持している。