DeepSeek V3

DeepSeek

変動分析 · 2026年 第12週

DeepSeek V3 2026年 第12週 コード実行次元が 42.6 点上昇。主にDebug:链表反转、数据流中位数で得点

スコア比較

52.9 66.6 +13.7
次元 前回 今回 変動
コード実行 20.2 62.8 +42.6
知識総合 36.4 44.3 +7.9
引用検証 62.3 78.2 +15.9
コストパフォーマンス 94 99.1 +5.1
安定性 53.4 32 -21.4
可用性 100 100 0

失点 Top 5

正则表达式编写
20 0 -20
コード実行 python_unit_test
詳細証拠を展開
前回の回答
```python pattern1 = r'^(?:\+86|0086)?1[3-9]\d{9}$' pattern2 = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$' pattern3 = r'^((25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\.){3}(25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)$' ```
今回の回答
```python pattern1 = r'^(?:\+86|0086)?1\d{10}$' pattern2 = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$' pattern3 = r'^(?:(?:25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\.){3}(?:25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)$' ```
浮点精度陷阱
10 0 -10
コード実行 exact_lines STRICT
詳細証拠を展開
前回の回答
False True True
今回の回答
False True True
代码输出:闭包
10 0 -10
コード実行 exact_lines STRICT
詳細証拠を展開
前回の回答
[2, 2, 2]
今回の回答
[2, 2, 2]
Debug:事件监听泄漏
10 0 -10
コード実行 diff_patch_unit_test STRICT
詳細証拠を展開
前回の回答
```javascript let resizeHandler = null; function mount() { if (resizeHandler) return; resizeHandler = () => { console.log(window.innerWidth); }; window.addEventListener('resize', resizeHandler); } function unmount() { if (resizeHandler) { window.removeEventListener('resize', resizeHandler); resizeHandler = null; } } ```
今回の回答
```javascript let resizeHandler = null; function mount() { if (resizeHandler) return; resizeHandler = () => { console.log(window.innerWidth); }; window.addEventListener('resize', resizeHandler); } function unmount() { if (resizeHandler) { window.removeEventListener('resize', resizeHandler); resizeHandler = null; } } ```
供应商推荐与未知项
66.7 63.5 -3.2
引用検証 citation_grounded
詳細証拠を展開
前回の回答
**推荐供应商:Alpha** **1. 推荐理由** Alpha方案满足所有硬性要求:吞吐量(20,000 > 18,000)、误报率(1.2% < 1.5%)、漏报率(1.1% > 0.8%,但仍在可接受范围,见澄清项)、支持私有化部署、数据可境内落地、上线周期(75天 < 90天)。其两年总成本为390万元(180+120+90),低于480万预算上限。在满足硬性要求的前提下,其价格最低,且上线周期有保障。 **2. 不推荐另外两家的关键原因** - **Beta**:不满足“必须支持私有化部署”的硬性要求(仅公有云托管),且数据境内存储未承诺,存在合规风险。 - **Gamma**:不满足“误报率不高于1.5%”的硬性要求(1.6% > 1.5%)。 **3. 在签约前必须澄清的未知项** - **对漏报率的确认与承诺**:Alpha的漏报率(1.1%)略高于硬性要求(0.8%)。必须与甲方确认此偏差是否可接受,并要求Alpha提供技术优化承诺或明确接受此指标作为验收标准。 - **边缘推理量产状态**:其边缘推理功能仅在PoC环境验证,需明确量产交付时间表、性能指标及与此相关的额外成本或责任。 - **接口文档成熟度**:需评估其现有接口文档是否满足集成需求,并明确“共同打磨”的具体范围、工期与责任划分。
今回の回答
**推荐供应商:Alpha** **1. 推荐理由** Alpha方案完全满足所有硬性要求:吞吐量(20,000 > 18,000)、误报率(1.2% < 1.5%)、漏报率(1.1% > 0.8%,但仍在可接受范围,见澄清项)、支持私有化部署、数据可境内落地、上线周期(75天 < 90天)。其两年总成本(180+120+90=390万)在预算上限480万内。同时,其支持边缘推理(加分项),尽管有风险。 **2. 不推荐另外两家的关键原因** - **Beta**:不满足“必须支持私有化部署”的硬性要求(仅公有云托管),且数据境内存储未承诺,存在合规风险。 - **Gamma**:不满足“误报率不高于1.5%”的硬性要求(其误报率为1.6%)。 **3. 在签约前必须澄清的未知项** - **对Alpha**:必须确认其1.1%的漏报率(略高于0.8%的要求)是否在甲方可接受的容差范围内,并书面明确。 - **对Alpha**:需评估其“边缘推理尚未量产”的风险对项目的影响,并明确量产支持的时间表与责任。

得点 Top 5

Debug:链表反转
10 100 +90
コード実行 diff_patch_unit_test STRICT
詳細証拠を展開
前回の回答
```python class ListNode: def __init__(self, val=0, next=None): self.val = val self.next = next def reverse_list(head): prev = None curr = head while curr: next_temp = curr.next # 保存下一个节点 curr.next = prev # 反转当前节点的指针 prev = curr # 移动prev到当前节点 curr = next_temp # 移动curr到下一个节点 return prev ``` 原因:原代码在修改`curr.next`后立即使用`curr = curr.next`,此时`curr.next`已指向`prev`,导致后续节点丢失。修正后先用临时变量保存原`curr.next`,再安全移动指针。
今回の回答
```python class ListNode: def __init__(self, val=0, next=None): self.val = val self.next = next def reverse_list(head): prev = None curr = head while curr: next_temp = curr.next # 保存下一个节点 curr.next = prev # 反转当前节点的指针 prev = curr # 移动prev到当前节点 curr = next_temp # 移动curr到下一个节点 return prev ``` 原因:原代码在修改`curr.next`后立即使用`curr = curr.next`,此时`curr.next`已指向`prev`,导致丢失原始链表的后继节点。修正后先保存`curr.next`到临时变量,再更新指针。
数据流中位数
10 95 +85
コード実行 python_unit_test STRICT
詳細証拠を展開
前回の回答
```python import heapq class MedianFinder: def __init__(self): self.small = [] # 最大堆(用负数实现) self.large = [] # 最小堆 def add_num(self, num: int) -> None: if len(self.small) == len(self.large): heapq.heappush(self.large, -heapq.heappushpop(self.small, -num)) else: heapq.heappush(self.small, -heapq.heappushpop(self.large, num)) def find_median(self) -> float: if len(self.small) == len(self.large): return (-self.small[0] + self.large[0]) / 2.0 else: return float(self.large[0]) ```
今回の回答
```python import heapq class MedianFinder: def __init__(self): self.small = [] # 最大堆(用负数实现) self.large = [] # 最小堆 def add_num(self, num: int) -> None: if not self.small or num <= -self.small[0]: heapq.heappush(self.small, -num) else: heapq.heappush(self.large, num) # 平衡两个堆 if len(self.small) > len(self.large) + 1: heapq.heappush(self.large, -heapq.heappop(self.small)) elif len(self.large) > len(self.small): heapq.heappush(self.small, -heapq.heappop(self.large)) def find_median(self) -> float: if len(self.small) > len(self.large): return -self.small[0] return (-self.small[0] + self.large[0]) / 2.0 ```
Debug:DFS 环检测
10 95 +85
コード実行 diff_patch_unit_test STRICT
詳細証拠を展開
前回の回答
```python def has_cycle(graph): visited = set() rec_stack = set() def dfs(node): if node in rec_stack: return True if node in visited: return False visited.add(node) rec_stack.add(node) for nei in graph.get(node, []): if dfs(nei): return True rec_stack.remove(node) return False for n in graph: if dfs(n): return True return False ```
今回の回答
```python def has_cycle(graph): visited = set() rec_stack = set() def dfs(node): if node in rec_stack: return True if node in visited: return False visited.add(node) rec_stack.add(node) for nei in graph.get(node, []): if dfs(nei): return True rec_stack.remove(node) return False for n in graph: if dfs(n): return True return False ```
位运算:判断2的幂与 bit count
20 100 +80
コード実行 python_unit_test STRICT
詳細証拠を展開
前回の回答
```python def is_power_of_2(n): return n > 0 and (n & (n - 1)) == 0 def count_bits(n): count = 0 while n: count += n & 1 n >>= 1 return count print(is_power_of_2(0)) print(is_power_of_2(8)) print(is_power_of_2(12)) print(count_bits(15)) ``` ``` False True False 4 ```
今回の回答
```python def is_power_of_2(n): return n > 0 and (n & (n - 1)) == 0 def count_bits(n): count = 0 while n: count += n & 1 n >>= 1 return count print(is_power_of_2(0)) print(is_power_of_2(8)) print(is_power_of_2(12)) print(count_bits(15)) ``` ``` False True False 4 ```
二分查找(左边界版)
20 95 +75
コード実行 python_unit_test STRICT
詳細証拠を展開
前回の回答
```python def binary_search(arr, target): left, right = 0, len(arr) - 1 result = -1 while left <= right: mid = left + (right - left) // 2 if arr[mid] == target: result = mid right = mid - 1 elif arr[mid] < target: left = mid + 1 else: right = mid - 1 return result ```
今回の回答
```python def binary_search(arr, target): left, right = 0, len(arr) - 1 result = -1 while left <= right: mid = left + (right - left) // 2 if arr[mid] == target: result = mid right = mid - 1 elif arr[mid] < target: left = mid + 1 else: right = mid - 1 return result ```
変動ランキングに戻る