DeepSeek R1

DeepSeek

変動分析 · 2026年 第12週

DeepSeek R1 2026年 第12週 コード実行次元が 47.4 点上昇。主にDebug:DFS 环检测、异常处理链で得点

スコア比較

49.0 65.8 +16.8
次元 前回 今回 変動
コード実行 20.5 67.9 +47.4
知識総合 36.4 42.9 +6.5
引用検証 60.2 78.3 +18.1
コストパフォーマンス 69.4 88.1 +18.7
安定性 53.7 31.6 -22.1
可用性 100 100 0

失点 Top 5

不夸大 SLA 的回复
50 10 -40
知識総合 honesty_gate STRICT
詳細証拠を展開
前回の回答
感谢您的信任。根据当前正式SLA,我们承诺99.9%的可用性。为确保大促稳定,我们正在扩容并制定了专项保障方案。建议双方提前进行业务流量评估与联调测试,这能有效预防潜在风险。我们期待与您携手共度双11。
今回の回答
感谢您的信任。根据当前正式SLA,我们承诺99.9%的服务可用性。为确保大促稳定,我们正在进行容量扩容,并建议双方在近期共同进行一次全链路压测,以提前发现并解决潜在瓶颈,最大程度保障活动体验。
浮点精度陷阱
10 0 -10
コード実行 exact_lines STRICT
詳細証拠を展開
前回の回答
False True True
今回の回答
False True True
代码输出:闭包
10 0 -10
コード実行 exact_lines STRICT
詳細証拠を展開
前回の回答
[2, 2, 2]
今回の回答
[2, 2, 2]
Debug:事件监听泄漏
10 0 -10
コード実行 diff_patch_unit_test STRICT
詳細証拠を展開
前回の回答
```javascript let resizeHandler = null; function mount() { if (resizeHandler) return; resizeHandler = () => { console.log(window.innerWidth); }; window.addEventListener('resize', resizeHandler); } function unmount() { if (resizeHandler) { window.removeEventListener('resize', resizeHandler); resizeHandler = null; } } ```
今回の回答
```javascript let resizeHandler = null; function mount() { if (resizeHandler) return; resizeHandler = () => { console.log(window.innerWidth); }; window.addEventListener('resize', resizeHandler); } function unmount() { if (resizeHandler) { window.removeEventListener('resize', resizeHandler); resizeHandler = null; } } ```
供应商推荐与未知项
66.7 61 -5.7
引用検証 citation_grounded
詳細証拠を展開
前回の回答
**推荐供应商:Alpha** **1. 推荐理由** Alpha方案完全满足所有硬性要求:吞吐量(20,000 > 18,000)、误报率(1.2% < 1.5%)、漏报率(1.1% > 0.8%,但仍在可接受范围,见澄清项)、支持私有化部署、数据可境内落地、上线周期(75天 < 90天)。其两年总成本为390万元(180+120+90),低于预算上限480万元。在满足硬性要求的前提下,其价格最具优势。 **2. 不推荐另外两家的关键原因** - **Beta**:不满足“必须支持私有化部署”的硬性要求(仅公有云托管),且数据境内存储未承诺(仅可申请),存在合规风险。 - **Gamma**:不满足“误报率不高于1.5%”的硬性要求(其误报率为1.6%)。 **3. 在签约前必须澄清的未知项** - **漏报率达标确认**:Alpha漏报率(1.1%)略高于需求(0.8%),需书面确认此指标是否可接受或是否有明确改进计划。 - **边缘推理风险**:其边缘推理功能“尚未量产”,需明确量产时间表、性能指标及对现有方案的影响。 - **接口文档**:评估其接口文档的成熟度,以确认是否满足集成需求。
今回の回答
**推荐供应商:Alpha** **1. 推荐理由** Alpha方案满足所有硬性要求:吞吐量(20,000 > 18,000)、误报率(1.2% < 1.5%)、漏报率(1.1% > 0.8%,但仍在可接受范围,见澄清项)、支持私有化部署、数据可境内落地、上线周期(75天 < 90天)。其两年总成本(180+120+90=390万元)低于预算上限(480万元),且实施周期较短。 **2. 不推荐另外两家的关键原因** - **Beta**:不满足“必须支持私有化部署”的硬性要求(仅公有云托管),且数据境内存储未承诺(仅可申请)。 - **Gamma**:不满足“误报率不高于1.5%”的硬性要求(其误报率为1.6%)。 **3. 在签约前必须澄清的未知项** - **漏报率达标确认**:Alpha漏报率(1.1%)略高于硬性要求(0.8%),需书面确认此指标是否可接受或承诺优化至0.8%以下。 - **边缘推理风险**:其边缘推理功能尚未量产,需明确量产时间表、性能指标及此部分是否影响项目验收。 - **接口文档**:需评估其接口文档的成熟度是否满足集成需求,并明确“共同打磨”的具体责任与时间。

得点 Top 5

Debug:DFS 环检测
10 100 +90
コード実行 diff_patch_unit_test STRICT
詳細証拠を展開
前回の回答
```python def has_cycle(graph): visited = set() rec_stack = set() def dfs(node): if node in rec_stack: return True if node in visited: return False visited.add(node) rec_stack.add(node) for nei in graph.get(node, []): if dfs(nei): return True rec_stack.remove(node) return False for n in graph: if dfs(n): return True return False ```
今回の回答
```python def has_cycle(graph): visited = set() rec_stack = set() def dfs(node): if node in rec_stack: return True if node in visited: return False rec_stack.add(node) visited.add(node) for nei in graph.get(node, []): if dfs(nei): return True rec_stack.remove(node) return False for n in graph: if n not in visited: if dfs(n): return True return False ```
异常处理链
10 95 +85
コード実行 python_unit_test STRICT
詳細証拠を展開
前回の回答
```python import json import logging def load_and_apply(path): try: try: text = read_config(path) except FileNotFoundError: logging.error("配置文件未找到") return False try: config = parse_config(text) except json.JSONDecodeError: logging.error("配置文件解析错误") return False try: apply_config(config) except ValueError: logging.error("配置应用错误") return False return True finally: print("配置加载流程结束") ```
今回の回答
```python import json import logging def load_and_apply(path): try: try: text = read_config(path) except FileNotFoundError: logging.error("配置文件未找到") return False try: config = parse_config(text) except json.JSONDecodeError: logging.error("配置文件解析失败") return False try: apply_config(config) except ValueError: logging.error("配置应用失败") return False return True finally: print("配置加载流程结束") ```
Debug:链表反转
10 95 +85
コード実行 diff_patch_unit_test STRICT
詳細証拠を展開
前回の回答
```python class ListNode: def __init__(self, val=0, next=None): self.val = val self.next = next def reverse_list(head): prev = None curr = head while curr: next_temp = curr.next # 保存下一个节点 curr.next = prev # 反转当前节点的指针 prev = curr # 移动prev到当前节点 curr = next_temp # 移动curr到下一个节点 return prev ``` 原因:原代码在修改`curr.next`后立即使用`curr = curr.next`,此时`curr.next`已指向`prev`,导致丢失原链表后续节点。修正后先保存`next_temp = curr.next`,再修改指针,最后移动`curr`到保存的节点。
今回の回答
```python class ListNode: def __init__(self, val=0, next=None): self.val = val self.next = next def reverse_list(head): prev = None curr = head while curr: next_temp = curr.next # 保存下一个节点 curr.next = prev # 反转当前节点的指针 prev = curr # 移动prev到当前节点 curr = next_temp # 移动到下一个节点 return prev ``` 原因:原代码在修改`curr.next`后立即使用`curr = curr.next`,此时`curr.next`已指向`prev`,导致丢失原始链表的下一个节点。必须先保存`curr.next`到临时变量,再更新指针。
数据流中位数
10 95 +85
コード実行 python_unit_test STRICT
詳細証拠を展開
前回の回答
```python import heapq class MedianFinder: def __init__(self): self.small = [] # 最大堆(用负数存储实现) self.large = [] # 最小堆 def add_num(self, num: int) -> None: if len(self.small) == len(self.large): heapq.heappush(self.large, -heapq.heappushpop(self.small, -num)) else: heapq.heappush(self.small, -heapq.heappushpop(self.large, num)) def find_median(self) -> float: if len(self.small) == len(self.large): return (-self.small[0] + self.large[0]) / 2.0 else: return float(self.large[0]) ```
今回の回答
```python import heapq class MedianFinder: def __init__(self): self.small = [] # 最大堆(用负数实现) self.large = [] # 最小堆 def add_num(self, num: int) -> None: if not self.small or num <= -self.small[0]: heapq.heappush(self.small, -num) else: heapq.heappush(self.large, num) # 平衡两个堆 if len(self.small) > len(self.large) + 1: heapq.heappush(self.large, -heapq.heappop(self.small)) elif len(self.large) > len(self.small): heapq.heappush(self.small, -heapq.heappop(self.large)) def find_median(self) -> float: if len(self.small) > len(self.large): return -self.small[0] return (-self.small[0] + self.large[0]) / 2.0 ```
位运算:判断2的幂与 bit count
20 100 +80
コード実行 python_unit_test STRICT
詳細証拠を展開
前回の回答
```python def is_power_of_2(n): return n > 0 and (n & (n - 1)) == 0 def count_bits(n): count = 0 while n: n &= n - 1 count += 1 return count print(is_power_of_2(0)) print(is_power_of_2(8)) print(is_power_of_2(12)) print(count_bits(15)) ``` ``` False True False 4 ```
今回の回答
```python def is_power_of_2(n): return n > 0 and (n & (n - 1)) == 0 def count_bits(n): count = 0 while n: count += n & 1 n >>= 1 return count print(is_power_of_2(0)) print(is_power_of_2(8)) print(is_power_of_2(12)) print(count_bits(15)) ``` ``` False True False 4 ```
変動ランキングに戻る