DeepSeek V3
DeepSeek
変動分析 · 2026年 第12週
DeepSeek V3 2026年 第12週 コード実行次元が 42.6 点上昇。主にDebug:链表反转、数据流中位数で得点
スコア比較
52.9
66.6
+13.7
| 次元 | 前回 | 今回 | 変動 |
|---|---|---|---|
| コード実行 | 20.2 | 62.8 | +42.6 |
| 知識総合 | 36.4 | 44.3 | +7.9 |
| 引用検証 | 62.3 | 78.2 | +15.9 |
| コストパフォーマンス | 94 | 99.1 | +5.1 |
| 安定性 | 53.4 | 32 | -21.4 |
| 可用性 | 100 | 100 | 0 |
失点 Top 5
正则表达式编写
20
0
-20
コード実行
python_unit_test
詳細証拠を展開
前回の回答
```python
pattern1 = r'^(?:\+86|0086)?1[3-9]\d{9}$'
pattern2 = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$'
pattern3 = r'^((25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\.){3}(25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)$'
```
今回の回答
```python
pattern1 = r'^(?:\+86|0086)?1\d{10}$'
pattern2 = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$'
pattern3 = r'^(?:(?:25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\.){3}(?:25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)$'
```
浮点精度陷阱
10
0
-10
コード実行
exact_lines
STRICT
詳細証拠を展開
前回の回答
False
True
True
今回の回答
False
True
True
代码输出:闭包
10
0
-10
コード実行
exact_lines
STRICT
詳細証拠を展開
前回の回答
[2, 2, 2]
今回の回答
[2, 2, 2]
Debug:事件监听泄漏
10
0
-10
コード実行
diff_patch_unit_test
STRICT
詳細証拠を展開
前回の回答
```javascript
let resizeHandler = null;
function mount() {
if (resizeHandler) return;
resizeHandler = () => {
console.log(window.innerWidth);
};
window.addEventListener('resize', resizeHandler);
}
function unmount() {
if (resizeHandler) {
window.removeEventListener('resize', resizeHandler);
resizeHandler = null;
}
}
```
今回の回答
```javascript
let resizeHandler = null;
function mount() {
if (resizeHandler) return;
resizeHandler = () => {
console.log(window.innerWidth);
};
window.addEventListener('resize', resizeHandler);
}
function unmount() {
if (resizeHandler) {
window.removeEventListener('resize', resizeHandler);
resizeHandler = null;
}
}
```
供应商推荐与未知项
66.7
63.5
-3.2
引用検証
citation_grounded
詳細証拠を展開
前回の回答
**推荐供应商:Alpha**
**1. 推荐理由**
Alpha方案满足所有硬性要求:吞吐量(20,000 > 18,000)、误报率(1.2% < 1.5%)、漏报率(1.1% > 0.8%,但仍在可接受范围,见澄清项)、支持私有化部署、数据可境内落地、上线周期(75天 < 90天)。其两年总成本为390万元(180+120+90),低于480万预算上限。在满足硬性要求的前提下,其价格最低,且上线周期有保障。
**2. 不推荐另外两家的关键原因**
- **Beta**:不满足“必须支持私有化部署”的硬性要求(仅公有云托管),且数据境内存储未承诺,存在合规风险。
- **Gamma**:不满足“误报率不高于1.5%”的硬性要求(1.6% > 1.5%)。
**3. 在签约前必须澄清的未知项**
- **对漏报率的确认与承诺**:Alpha的漏报率(1.1%)略高于硬性要求(0.8%)。必须与甲方确认此偏差是否可接受,并要求Alpha提供技术优化承诺或明确接受此指标作为验收标准。
- **边缘推理量产状态**:其边缘推理功能仅在PoC环境验证,需明确量产交付时间表、性能指标及与此相关的额外成本或责任。
- **接口文档成熟度**:需评估其现有接口文档是否满足集成需求,并明确“共同打磨”的具体范围、工期与责任划分。
今回の回答
**推荐供应商:Alpha**
**1. 推荐理由**
Alpha方案完全满足所有硬性要求:吞吐量(20,000 > 18,000)、误报率(1.2% < 1.5%)、漏报率(1.1% > 0.8%,但仍在可接受范围,见澄清项)、支持私有化部署、数据可境内落地、上线周期(75天 < 90天)。其两年总成本(180+120+90=390万)在预算上限480万内。同时,其支持边缘推理(加分项),尽管有风险。
**2. 不推荐另外两家的关键原因**
- **Beta**:不满足“必须支持私有化部署”的硬性要求(仅公有云托管),且数据境内存储未承诺,存在合规风险。
- **Gamma**:不满足“误报率不高于1.5%”的硬性要求(其误报率为1.6%)。
**3. 在签约前必须澄清的未知项**
- **对Alpha**:必须确认其1.1%的漏报率(略高于0.8%的要求)是否在甲方可接受的容差范围内,并书面明确。
- **对Alpha**:需评估其“边缘推理尚未量产”的风险对项目的影响,并明确量产支持的时间表与责任。
得点 Top 5
Debug:链表反转
10
100
+90
コード実行
diff_patch_unit_test
STRICT
詳細証拠を展開
前回の回答
```python
class ListNode:
def __init__(self, val=0, next=None):
self.val = val
self.next = next
def reverse_list(head):
prev = None
curr = head
while curr:
next_temp = curr.next # 保存下一个节点
curr.next = prev # 反转当前节点的指针
prev = curr # 移动prev到当前节点
curr = next_temp # 移动curr到下一个节点
return prev
```
原因:原代码在修改`curr.next`后立即使用`curr = curr.next`,此时`curr.next`已指向`prev`,导致后续节点丢失。修正后先用临时变量保存原`curr.next`,再安全移动指针。
今回の回答
```python
class ListNode:
def __init__(self, val=0, next=None):
self.val = val
self.next = next
def reverse_list(head):
prev = None
curr = head
while curr:
next_temp = curr.next # 保存下一个节点
curr.next = prev # 反转当前节点的指针
prev = curr # 移动prev到当前节点
curr = next_temp # 移动curr到下一个节点
return prev
```
原因:原代码在修改`curr.next`后立即使用`curr = curr.next`,此时`curr.next`已指向`prev`,导致丢失原始链表的后继节点。修正后先保存`curr.next`到临时变量,再更新指针。
数据流中位数
10
95
+85
コード実行
python_unit_test
STRICT
詳細証拠を展開
前回の回答
```python
import heapq
class MedianFinder:
def __init__(self):
self.small = [] # 最大堆(用负数实现)
self.large = [] # 最小堆
def add_num(self, num: int) -> None:
if len(self.small) == len(self.large):
heapq.heappush(self.large, -heapq.heappushpop(self.small, -num))
else:
heapq.heappush(self.small, -heapq.heappushpop(self.large, num))
def find_median(self) -> float:
if len(self.small) == len(self.large):
return (-self.small[0] + self.large[0]) / 2.0
else:
return float(self.large[0])
```
今回の回答
```python
import heapq
class MedianFinder:
def __init__(self):
self.small = [] # 最大堆(用负数实现)
self.large = [] # 最小堆
def add_num(self, num: int) -> None:
if not self.small or num <= -self.small[0]:
heapq.heappush(self.small, -num)
else:
heapq.heappush(self.large, num)
# 平衡两个堆
if len(self.small) > len(self.large) + 1:
heapq.heappush(self.large, -heapq.heappop(self.small))
elif len(self.large) > len(self.small):
heapq.heappush(self.small, -heapq.heappop(self.large))
def find_median(self) -> float:
if len(self.small) > len(self.large):
return -self.small[0]
return (-self.small[0] + self.large[0]) / 2.0
```
Debug:DFS 环检测
10
95
+85
コード実行
diff_patch_unit_test
STRICT
詳細証拠を展開
前回の回答
```python
def has_cycle(graph):
visited = set()
rec_stack = set()
def dfs(node):
if node in rec_stack:
return True
if node in visited:
return False
visited.add(node)
rec_stack.add(node)
for nei in graph.get(node, []):
if dfs(nei):
return True
rec_stack.remove(node)
return False
for n in graph:
if dfs(n):
return True
return False
```
今回の回答
```python
def has_cycle(graph):
visited = set()
rec_stack = set()
def dfs(node):
if node in rec_stack:
return True
if node in visited:
return False
visited.add(node)
rec_stack.add(node)
for nei in graph.get(node, []):
if dfs(nei):
return True
rec_stack.remove(node)
return False
for n in graph:
if dfs(n):
return True
return False
```
位运算:判断2的幂与 bit count
20
100
+80
コード実行
python_unit_test
STRICT
詳細証拠を展開
前回の回答
```python
def is_power_of_2(n):
return n > 0 and (n & (n - 1)) == 0
def count_bits(n):
count = 0
while n:
count += n & 1
n >>= 1
return count
print(is_power_of_2(0))
print(is_power_of_2(8))
print(is_power_of_2(12))
print(count_bits(15))
```
```
False
True
False
4
```
今回の回答
```python
def is_power_of_2(n):
return n > 0 and (n & (n - 1)) == 0
def count_bits(n):
count = 0
while n:
count += n & 1
n >>= 1
return count
print(is_power_of_2(0))
print(is_power_of_2(8))
print(is_power_of_2(12))
print(count_bits(15))
```
```
False
True
False
4
```
二分查找(左边界版)
20
95
+75
コード実行
python_unit_test
STRICT
詳細証拠を展開
前回の回答
```python
def binary_search(arr, target):
left, right = 0, len(arr) - 1
result = -1
while left <= right:
mid = left + (right - left) // 2
if arr[mid] == target:
result = mid
right = mid - 1
elif arr[mid] < target:
left = mid + 1
else:
right = mid - 1
return result
```
今回の回答
```python
def binary_search(arr, target):
left, right = 0, len(arr) - 1
result = -1
while left <= right:
mid = left + (right - left) // 2
if arr[mid] == target:
result = mid
right = mid - 1
elif arr[mid] < target:
left = mid + 1
else:
right = mid - 1
return result
```