DeepSeek V3

DeepSeek

変動分析 · 2026年第12週

DeepSeek V3 2026年第12週コード実行次元が 42.6 点上昇。主にDebug：链表反转、数据流中位数で得点

スコア比較

52.9 66.6 +13.7

次元	前回	今回	変動
コード実行	20.2	62.8	+42.6
知識総合	36.4	44.3	+7.9
引用検証	62.3	78.2	+15.9
コストパフォーマンス	94	99.1	+5.1
安定性	53.4	32	-21.4
可用性	100	100	0

失点 Top 5

正则表达式编写

20 0 -20

コード実行 python_unit_test

詳細証拠を展開

前回の回答

```python
pattern1 = r'^(?:\+86|0086)?1[3-9]\d{9}$'
pattern2 = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$'
pattern3 = r'^((25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\.){3}(25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)$'
```

今回の回答

```python
pattern1 = r'^(?:\+86|0086)?1\d{10}$'
pattern2 = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$'
pattern3 = r'^(?:(?:25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)\.){3}(?:25[0-5]|2[0-4]\d|1\d{2}|[1-9]?\d)$'
```

浮点精度陷阱

10 0 -10

コード実行 exact_lines STRICT

詳細証拠を展開

前回の回答

False  
True  
True

今回の回答

False  
True  
True

代码输出：闭包

10 0 -10

コード実行 exact_lines STRICT

詳細証拠を展開

前回の回答

[2, 2, 2]

今回の回答

[2, 2, 2]

Debug：事件监听泄漏

10 0 -10

コード実行 diff_patch_unit_test STRICT

詳細証拠を展開

前回の回答

```javascript
let resizeHandler = null;

function mount() {
  if (resizeHandler) return;
  
  resizeHandler = () => {
    console.log(window.innerWidth);
  };
  
  window.addEventListener('resize', resizeHandler);
}

function unmount() {
  if (resizeHandler) {
    window.removeEventListener('resize', resizeHandler);
    resizeHandler = null;
  }
}
```

今回の回答

```javascript
let resizeHandler = null;

function mount() {
  if (resizeHandler) return;
  
  resizeHandler = () => {
    console.log(window.innerWidth);
  };
  
  window.addEventListener('resize', resizeHandler);
}

function unmount() {
  if (resizeHandler) {
    window.removeEventListener('resize', resizeHandler);
    resizeHandler = null;
  }
}
```

供应商推荐与未知项

66.7 63.5 -3.2

引用検証 citation_grounded

詳細証拠を展開

前回の回答

**推荐供应商：Alpha**

**1. 推荐理由**
Alpha方案满足所有硬性要求：吞吐量（20,000 > 18,000）、误报率（1.2% < 1.5%）、漏报率（1.1% > 0.8%，但仍在可接受范围，见澄清项）、支持私有化部署、数据可境内落地、上线周期（75天 < 90天）。其两年总成本为390万元（180+120+90），低于480万预算上限。在满足硬性要求的前提下，其价格最低，且上线周期有保障。

**2. 不推荐另外两家的关键原因**
- **Beta**：不满足“必须支持私有化部署”的硬性要求（仅公有云托管），且数据境内存储未承诺，存在合规风险。
- **Gamma**：不满足“误报率不高于1.5%”的硬性要求（1.6% > 1.5%）。

**3. 在签约前必须澄清的未知项**
- **对漏报率的确认与承诺**：Alpha的漏报率（1.1%）略高于硬性要求（0.8%）。必须与甲方确认此偏差是否可接受，并要求Alpha提供技术优化承诺或明确接受此指标作为验收标准。
- **边缘推理量产状态**：其边缘推理功能仅在PoC环境验证，需明确量产交付时间表、性能指标及与此相关的额外成本或责任。
- **接口文档成熟度**：需评估其现有接口文档是否满足集成需求，并明确“共同打磨”的具体范围、工期与责任划分。

今回の回答

**推荐供应商：Alpha**

**1. 推荐理由**
Alpha方案完全满足所有硬性要求：吞吐量（20,000 > 18,000）、误报率（1.2% < 1.5%）、漏报率（1.1% > 0.8%，但仍在可接受范围，见澄清项）、支持私有化部署、数据可境内落地、上线周期（75天 < 90天）。其两年总成本（180+120+90=390万）在预算上限480万内。同时，其支持边缘推理（加分项），尽管有风险。

**2. 不推荐另外两家的关键原因**
- **Beta**：不满足“必须支持私有化部署”的硬性要求（仅公有云托管），且数据境内存储未承诺，存在合规风险。
- **Gamma**：不满足“误报率不高于1.5%”的硬性要求（其误报率为1.6%）。

**3. 在签约前必须澄清的未知项**
- **对Alpha**：必须确认其1.1%的漏报率（略高于0.8%的要求）是否在甲方可接受的容差范围内，并书面明确。
- **对Alpha**：需评估其“边缘推理尚未量产”的风险对项目的影响，并明确量产支持的时间表与责任。

得点 Top 5

Debug：链表反转

10 100 +90

コード実行 diff_patch_unit_test STRICT

詳細証拠を展開

前回の回答

```python
class ListNode:
    def __init__(self, val=0, next=None):
        self.val = val
        self.next = next

def reverse_list(head):
    prev = None
    curr = head
    while curr:
        next_temp = curr.next  # 保存下一个节点
        curr.next = prev       # 反转当前节点的指针
        prev = curr            # 移动prev到当前节点
        curr = next_temp       # 移动curr到下一个节点
    return prev
```

原因：原代码在修改`curr.next`后立即使用`curr = curr.next`，此时`curr.next`已指向`prev`，导致后续节点丢失。修正后先用临时变量保存原`curr.next`，再安全移动指针。

今回の回答

```python
class ListNode:
    def __init__(self, val=0, next=None):
        self.val = val
        self.next = next

def reverse_list(head):
    prev = None
    curr = head
    while curr:
        next_temp = curr.next  # 保存下一个节点
        curr.next = prev       # 反转当前节点的指针
        prev = curr            # 移动prev到当前节点
        curr = next_temp       # 移动curr到下一个节点
    return prev
```

原因：原代码在修改`curr.next`后立即使用`curr = curr.next`，此时`curr.next`已指向`prev`，导致丢失原始链表的后继节点。修正后先保存`curr.next`到临时变量，再更新指针。

数据流中位数

10 95 +85

コード実行 python_unit_test STRICT

詳細証拠を展開

前回の回答

```python
import heapq

class MedianFinder:
    def __init__(self):
        self.small = []  # 最大堆（用负数实现）
        self.large = []  # 最小堆

    def add_num(self, num: int) -> None:
        if len(self.small) == len(self.large):
            heapq.heappush(self.large, -heapq.heappushpop(self.small, -num))
        else:
            heapq.heappush(self.small, -heapq.heappushpop(self.large, num))

    def find_median(self) -> float:
        if len(self.small) == len(self.large):
            return (-self.small[0] + self.large[0]) / 2.0
        else:
            return float(self.large[0])
```

今回の回答

```python
import heapq

class MedianFinder:
    def __init__(self):
        self.small = []  # 最大堆（用负数实现）
        self.large = []  # 最小堆

    def add_num(self, num: int) -> None:
        if not self.small or num <= -self.small[0]:
            heapq.heappush(self.small, -num)
        else:
            heapq.heappush(self.large, num)
        
        # 平衡两个堆
        if len(self.small) > len(self.large) + 1:
            heapq.heappush(self.large, -heapq.heappop(self.small))
        elif len(self.large) > len(self.small):
            heapq.heappush(self.small, -heapq.heappop(self.large))

    def find_median(self) -> float:
        if len(self.small) > len(self.large):
            return -self.small[0]
        return (-self.small[0] + self.large[0]) / 2.0
```

Debug：DFS 环检测

10 95 +85

コード実行 diff_patch_unit_test STRICT

詳細証拠を展開

前回の回答

```python
def has_cycle(graph):
    visited = set()
    rec_stack = set()

    def dfs(node):
        if node in rec_stack:
            return True
        if node in visited:
            return False

        visited.add(node)
        rec_stack.add(node)

        for nei in graph.get(node, []):
            if dfs(nei):
                return True

        rec_stack.remove(node)
        return False

    for n in graph:
        if dfs(n):
            return True
    return False
```

今回の回答

```python
def has_cycle(graph):
    visited = set()
    rec_stack = set()

    def dfs(node):
        if node in rec_stack:
            return True
        if node in visited:
            return False

        visited.add(node)
        rec_stack.add(node)

        for nei in graph.get(node, []):
            if dfs(nei):
                return True

        rec_stack.remove(node)
        return False

    for n in graph:
        if dfs(n):
            return True
    return False
```

位运算：判断2的幂与 bit count

20 100 +80

コード実行 python_unit_test STRICT

詳細証拠を展開

前回の回答

```python
def is_power_of_2(n):
    return n > 0 and (n & (n - 1)) == 0

def count_bits(n):
    count = 0
    while n:
        count += n & 1
        n >>= 1
    return count

print(is_power_of_2(0))
print(is_power_of_2(8))
print(is_power_of_2(12))
print(count_bits(15))
```

```
False
True
False
4
```

今回の回答

```python
def is_power_of_2(n):
    return n > 0 and (n & (n - 1)) == 0

def count_bits(n):
    count = 0
    while n:
        count += n & 1
        n >>= 1
    return count

print(is_power_of_2(0))
print(is_power_of_2(8))
print(is_power_of_2(12))
print(count_bits(15))
```

```
False
True
False
4
```

二分查找（左边界版）

20 95 +75

コード実行 python_unit_test STRICT

詳細証拠を展開

前回の回答

```python
def binary_search(arr, target):
    left, right = 0, len(arr) - 1
    result = -1
    
    while left <= right:
        mid = left + (right - left) // 2
        
        if arr[mid] == target:
            result = mid
            right = mid - 1
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    
    return result
```

今回の回答

```python
def binary_search(arr, target):
    left, right = 0, len(arr) - 1
    result = -1
    
    while left <= right:
        mid = left + (right - left) // 2
        
        if arr[mid] == target:
            result = mid
            right = mid - 1
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
            
    return result
```

変動ランキングに戻る