质量工程-03-需求评审阶段测试应该重点拦哪些风险

发表于 2021-09-23 分类于质量工程本文字数： 4k 阅读时长 ≈ 14 分钟

提到需求评审时，测试经常只做两件事：

听产品讲一遍需求
记几个待确认问题

这种参与方式看起来没有缺席，但实际价值很有限。因为需求评审阶段最关键的，不是“知道版本要做什么”，而是：

在开发开始之前，把后面最容易返工、漏测、上线后出事故的风险尽量拦下来。

这篇文章不讲“测试左移有多重要”，只讲一个更实际的问题：

需求评审阶段，测试到底应该重点拦哪些风险，怎么拦，拦完之后怎么追踪，才能真正影响后续质量结果。

一、需求评审阶段最容易被低估的，不是细节，而是风险分类能力

很多测试在评审会上提的问题并不少，但最后效果一般，根因通常不是“不认真”，而是提问没有按风险类型展开。

例如：

只盯页面字段，没有看状态流转
只盯主流程，没有追异常分支
只问“怎么做”，没有问“失败了怎么办”
只关心页面表现，没有问数据口径和下游影响

需求评审阶段如果没有风险分类意识，很容易出现一种假象：

会开了
问题也问了
但真正该拦的风险还是没拦住

更推荐在需求评审时，固定从下面六类风险切入：

业务规则风险
状态流转风险
数据与口径风险
系统依赖与边界风险
可测性与可观测性风险
发布、回滚与存量兼容风险

这六类风险基本覆盖了一个版本后面最常见的质量事故来源。

二、第一类要重点拦的，是业务规则没有说完整

很多线上问题，不是实现难，而是业务规则在评审时根本没讲完整。

最典型的信号包括：

只描述了正常流程，没有定义失败处理
只讲新增能力，没有讲旧逻辑是否受影响
只讲一个角色怎么用，没有讲多角色看到的结果是否一致
只讲“支持配置”，没有讲配置什么时候生效、谁能改、改错怎么办

这类风险如果评审阶段不拦，后面通常会演变成三种问题：

开发按自己理解实现，测试按另一套理解验证
测试阶段才发现分支不全，导致补设计、补联调
上线后出现“这不是 bug，是需求没说”的扯皮

评审时应该固定追问的动作

正常流程之外，失败、超时、重试、幂等分别怎么处理
旧数据、旧用户、旧流程是否需要兼容
不同角色、不同端、不同入口是否规则一致
开关、配置、审批、撤销这类动作的生效边界是什么

这类风险的会中证据

通常不会只记“待确认”，而是会明确留下：

哪一条规则当前不完整
谁负责补定义
需要补到需求文档、接口文档还是流程图
补完前哪些测试设计不能继续往下做

如果会中没有把这些写成明确待办，问题大概率会在开发中后期重新出现。

三、第二类要重点拦的，是状态流转没有闭环

需求评审时最容易漏掉的高风险点，不是功能入口，而是状态。

只要需求涉及下面这些对象，就必须盯状态流转：

订单
审批单
工单
任务
资源
账户

很多版本看起来只是“加一个状态”或者“多一个按钮”，但真正危险的是：

状态进入条件不清楚
状态退出条件不清楚
失败后是否回滚不清楚
人工处理和系统处理是否会打架不清楚
并发操作下状态是否会错乱不清楚

评审时会要求至少补一张状态表

当前状态	触发动作	操作人/系统	下一个状态	失败处理	是否可逆
待提交	用户提交	用户	待审核	返回错误并保留草稿	是
待审核	审批通过	审批人	已生效	记录原因并停留原状态	否
待审核	审批驳回	审批人	已驳回	给出驳回原因	是

状态表不一定很复杂，但至少要有。没有这张表，后面最容易出现：

产品脑子里一套状态图
开发代码里一套状态机
测试用例里又是一套理解

常见漏拦点

只定义主链路状态，没有定义取消、撤销、驳回、超时
只定义页面状态，没有定义数据库或下游系统状态
没有说明定时任务、补偿任务对状态的影响
没有说明同一对象被重复提交、重复审批时怎么处理

四、第三类要重点拦的，是数据口径和结果校验标准不一致

很多需求评审会里，现场都默认“字段加上了就行”，但真正上线后最容易出争议的是：

统计口径不一致
展示口径和落库口径不一致
列表、详情、导出、报表的数据不一致
实时数据和异步汇总数据的刷新时机不一致

如果需求涉及：

金额
数量
成功率
转化率
时长
状态统计

那测试在评审阶段必须盯紧数据口径。

评审时必须确认的几个问题

字段来源是什么，主数据在哪
实时算还是异步算
是否允许延迟，延迟多久算正常
展示值是否经过格式化、四舍五入或脱敏
导出、接口、页面三处口径是否必须一致

最小检查清单

是否有口径说明文档
是否明确主数据源
是否明确补数、重算、重试机制
是否明确异常数据怎么展示
是否明确测试如何构造对账样本

这类风险很典型的一点是：

评审阶段没人拦，测试阶段只能看页面“像是对的”，上线后业务方才会发现统计不对。

五、第四类要重点拦的，是依赖边界和责任边界不清楚

很多需求失败，不是本系统代码有问题，而是：

依赖服务没准备好
三方接口行为和文档不一致
上下游责任边界没有讲清楚
某一步失败后到底谁补偿没人定义

如果需求是跨系统、跨团队、跨环境协同的，评审时一定不能只盯本页面、本接口。

通常会把依赖拆成四层

上游输入依赖
本系统处理逻辑
下游调用依赖
异步任务和补偿链路

然后逐层确认：

谁提供数据
什么时候到位
不到位时系统怎么表现
返回异常时谁负责兜底
测试环境有没有真实联调条件

常见漏拦点

只说“调用接口”，没说超时、限流、失败码怎么处理
只说“依赖外部系统”，没说测试环境是否可用
只说“异步通知”，没说重复通知、乱序通知怎么处理
只说“失败重试”，没说重试上限和人工介入方式

六、第五类要重点拦的，是需求可测性太差

很多版本不是不能测，而是测起来特别痛苦：

没有日志定位点
没有关键埋点
没有开关控制
没有造数和清数手段
没有唯一标识串起链路

这些问题如果到了联调或提测阶段才暴露，测试就会进入一种高消耗状态：

只能靠人肉猜
问题复现一次很慢
失败了拿不到证据
环境脏了收不回来

所以需求评审时，测试除了看功能，还应该看“能不能测”和“出了问题能不能查”。

通常会在评审会上明确提出的可测性要求

关键链路是否有唯一请求 ID 或业务流水号
关键分支是否有可检索日志
是否需要补监控、埋点、告警
是否需要预留测试开关、白名单、模拟数据入口
是否有稳定造数、回收、重置手段

这类风险如果不拦，后面最容易变成什么

用例设计出来了，但环境根本跑不通
问题出现了，但日志里找不到证据
一轮回归结束后，环境已经污染，下一轮没法继续

七、第六类要重点拦的，是发布、回滚和存量兼容没有设计

需求评审最容易被忽略的一块，是默认发布会平滑推进。

但真实项目里，很多事故都出在：

新旧版本切换期间
存量数据迁移期间
配置变更生效期间
回滚之后状态不一致

只要需求涉及以下情况，就必须在评审阶段把发布与回滚拉进来：

数据结构变更
配置项新增或替换
老接口废弃
新旧逻辑并存
定时任务切换

评审时应该确认的动作

这次上线是否需要灰度、分批、开关控制
回滚时数据是否可逆
存量数据是否要迁移、补算、回填
新旧版本并存时接口和页面如何兼容
失败后是否有人工兜底方案

常见漏拦点

只设计上线成功路径，没有设计回滚路径
只考虑新建数据，没有考虑历史数据读写
只考虑代码回滚，没有考虑配置和任务回滚
只考虑单服务上线，没有考虑多服务版本不一致

八、需求评审不是开完会就结束，必须有会后追踪机制

很多测试在需求评审阶段其实发现了问题，但最后仍然没拦住，原因往往不是会上没提，而是：

会后没人追
待确认项没有关闭标准
文档没改，口头结论丢了
风险进入开发阶段后被遗忘

所以更合适的做法是把需求评审输出成一张可以继续跟踪的风险表。

九、最小可执行实践：需求评审风险跟踪表

风险编号	风险类型	风险描述	当前状态	责任人	截止时间	关闭证据
R-01	业务规则	驳回后是否允许再次提交未定义	待补充	产品	9/24	需求文档更新
R-02	状态流转	超时自动关闭逻辑未明确	处理中	开发	9/25	状态图+接口说明
R-03	可测性	缺少唯一流水号，问题无法串联日志	待实现	开发	9/27	日志字段上线
R-04	发布回滚	存量数据迁移失败兜底未定义	待确认	产品/开发	9/28	发布方案更新

这张表最关键的不是“记录”，而是关闭标准需要具体，例如：

需求文档补充完成
接口文档更新完成
状态图补齐完成
日志字段实现完成
发布方案补齐完成

如果关闭证据写成“已确认”“已沟通”，那后面几乎一定会反复出问题。

十、我在需求评审时会实际执行的一套检查顺序

为了避免问题提得散，可以按下面顺序过：

先看影响范围：是不是核心链路、是不是跨系统、是不是改老逻辑
再看业务规则：成功、失败、异常、重试、幂等是否定义
再看状态流转：状态进入、退出、回滚、并发是否定义
再看数据口径：来源、时机、展示、导出、报表是否一致
再看依赖边界：上下游、异步链路、三方依赖是否明确
最后看可测性和发布：日志、开关、造数、灰度、回滚是否具备

这个顺序的好处是，提问不会只停留在页面和字段层，而是能把后面最贵的问题提前翻出来。

十一、真实案例：一个“只是加审批字段”的需求，最后为什么拖成了线上事故

场景

某次版本要在后台审批流程里新增一个“二次确认原因”字段。产品最初给出的描述很简单：

审批页面增加一个输入框
审批通过时把原因带上
列表页增加展示列

如果只看表面，这更像一个小需求。

执行

在需求评审会上，我没有只盯页面字段，而是顺着几个方向继续追：

审批驳回时这个字段是否也要保留
二次提交后旧原因是否覆盖
导出报表是否要显示这个字段
审批通过后同步到下游系统的字段名和长度限制是什么
回滚版本后旧数据如何展示

会中产品和开发一开始都认为“这些后面再看也行”，但继续展开后发现：

下游系统字段长度只有 64，而页面允许输入 200
驳回后再次提交是否沿用旧原因没有定义
报表导出没有同步设计
回滚后旧页面不认识新增字段的展示逻辑

现象

如果这些问题当时不拦，最容易出现的线上结果就是：

页面录入成功，但同步下游失败
列表里看得到，导出里看不到
驳回重提后原因被覆盖或丢失
回滚后历史记录展示异常

排查

我把这次需求拆成了一张评审风险表，并要求在提测前必须补齐四类证据：

需求文档补业务规则
接口文档补字段长度和失败码
状态表补驳回重提逻辑
发布方案补回滚兼容说明

然后在版本中期复查时，对照风险表逐项核对，发现发布方案仍然没有补旧页面兼容逻辑，及时把这个问题再次拎出来。

修复

最后这次需求在开发阶段就完成了几项修正：

页面输入长度收紧到 64
驳回重提时保留旧原因并允许编辑
导出接口和列表展示统一口径
回滚场景下旧页面展示为空但不报错

这件事的价值不在于“多问了几个问题”，而在于：

如果这些问题等到提测或上线后再暴露，代价会远远大于需求评审阶段的 20 分钟追问。

十二、结语

需求评审阶段测试最该做的，不是证明自己参与了流程，而是把后面最容易炸版本的风险提前拦下来。

真正高价值的评审问题，通常都集中在：

规则是否完整
状态是否闭环
数据口径是否一致
依赖边界是否明确
可测性是否具备
发布与回滚是否可控

如果这几类风险在评审阶段都没人拦，后面的测试再努力，很多时候也只能被动补洞。

所以测试在需求评审里的价值，不是“会后补用例”，而是：

用结构化的风险判断，把本来会晚爆炸的问题，尽量提前消化在版本开始之前。