测试平台-01-从脚本到平台：自动化测试系统的演进

发表于 2021-07-08 分类于测试平台本文字数： 2.6k 阅读时长 ≈ 10 分钟

第一次想做测试平台时，动机通常很朴素：

脚本越来越多
人越来越多
任务越来越杂
每次跑都得靠某个“熟悉脚本的人”

这时候很容易得出一个表面结论：

需要一个平台来把这些能力收起来

但如果继续往下问一句：

平台到底要解决什么问题

其实回答不清楚。

于是后面最常见的结果就是：

把脚本换了个页面入口
加了个任务列表
能点“执行”

然后很快又发现：

环境还是乱
日志还是散
报告还是不统一
失败还是不知道怎么排
新人还是接不住

所以需要强调的是，“从脚本到平台”真正的核心，不是把执行入口从命令行搬到网页上，而是把一堆零散能力变成一个可持续运行的系统。

这篇文章就想把这个问题讲清楚：

自动化测试系统为什么会从脚本走到平台，它中间到底解决了哪些真实工程问题。

一、脚本阶段最大的问题，不是功能不够，而是组织方式开始失控

最开始的自动化都没问题：

有脚本
能执行
能出结果

在早期阶段，这已经足够有价值。

但当系统继续发展，问题会逐渐从“有没有脚本”转成“脚本怎么被组织”。

常见症状包括：

脚本散落在多人本地环境
一套脚本只有少数人知道怎么跑
执行前置条件没人说得清
同一类任务反复造轮子
失败后证据留存不一致
报告和日志口径完全不统一

到这个阶段，团队真正痛的已经不是“少一个脚本”，而是：

自动化能力无法稳定复用。

二、这里理解的平台化，本质上是在解决 6 类工程问题

如果要压缩，会把平台化价值收在这 6 类问题里。

1. 执行入口统一

在脚本阶段，经常是：

A 同学本地能跑
B 同学换台机器就跑不起来
执行参数靠口口相传

平台化后，最基础的一层是：

谁来跑
跑哪套
用什么参数

这些要有统一入口。

2. 环境管理统一

很多自动化问题表面上像脚本问题，实际上是环境问题。

例如：

账号没准备
测试数据脏了
依赖服务版本不一致
浏览器、驱动、设备状态不统一

平台化如果不解决环境问题，后面所有执行稳定性都会很差。

3. 调度和执行统一

脚本阶段常见的模式是：

手工跑
定时跑
Jenkins 跑

但这些入口互相分裂，很快会带来：

相同任务多处配置
执行队列冲突
任务状态无法统一追踪

所以平台化一定会走到任务调度和执行引擎。

4. 结果与证据统一

平台真正有价值的一层，是把执行结果沉淀成统一资产。

否则就会一直停留在：

任务是跑了
但结果散在控制台、日志文件、截图目录、聊天记录里

这对团队协作几乎没有长期价值。

5. 权限与协作统一

一旦平台开始被多人使用，就必须回答：

谁能看什么
谁能跑什么
谁能改配置
谁能操作生产或高风险环境

这一步不做，平台很快就会变成新的风险源。

6. 接入与闭环统一

平台不是孤立存在的。

最终它通常还要接进：

Jenkins
告警
巡检
报表
缺陷提单

如果这些还完全靠人工串，平台价值会被大幅削弱。

三、平台化的真正分水岭，不是有没有前端，而是有没有系统边界

做平台，最容易被带偏的一个点是：

先画页面
先做列表
先做按钮

这些当然需要，但它们不构成真正的平台边界。

更看重的是下面几个问题有没有被明确回答：

平台负责什么，不负责什么
哪些能力属于公共能力
哪些仍然留在脚本或项目侧
数据、任务、环境、报告之间如何串起来

如果这些边界没先想清楚，平台最后很容易变成：

什么都做一点
什么都不完整

四、从脚本走到平台，通常会经历哪几个阶段

在实际项目里，更常见的演进路径不是“一步到位”，而是下面几段。

1. 单机脚本阶段

特点：

能跑
能验证
依赖个人经验

这个阶段重点是快速出结果，不是体系化。

2. 脚本框架阶段

开始会补：

目录结构
公共方法
配置管理
报告输出

这一步解决的是“脚本可维护性”。

3. 流水线接入阶段

开始接：

Jenkins
定时任务
回归任务

这一步解决的是“脚本可持续执行”。

4. 轻平台阶段

开始出现：

任务入口
参数配置
执行记录
统一报告

这一步解决的是“多人可用”。

5. 平台系统阶段

真正的平台化会继续往下走到：

权限模型
调度引擎
环境管理
资产沉淀
告警闭环

这一步解决的是“团队级能力复用”。

五、更推荐的平台化切入点，不是“大而全”，而是先抓住最痛的一条链路

平台化最容易失败的方式，就是一开始想做太全。

更推荐的切入方式是：

先抓住一条最痛、最稳定、最值得复用的链路

例如：

接口回归
UI 巡检
生产巡检
定时任务执行

只要其中一条链路被做顺，平台雏形就会自然长出来。

反过来，如果一开始就想同时做：

任务调度
环境管理
设备池
报告中心
权限系统
CI/CD 集成

项目通常会非常重，而且很容易失焦。

六、一套更实用的最小平台化骨架

如果现在从 0 开始做，更倾向至少先有下面这些。

1. 任务中心

至少回答：

有哪些任务
怎么触发
当前状态是什么

2. 执行器

至少回答：

任务由谁执行
执行日志怎么收
失败后如何留证

3. 配置与环境

至少回答：

参数放哪里
环境怎么切
依赖资源如何准备

4. 结果中心

至少回答：

执行结果如何统一查看
日志、截图、报告如何关联

5. 接入层

至少回答：

怎么接 Jenkins
怎么接告警
怎么接外部系统

这套东西不需要一次做完，但边界上最好先有意识。

七、最容易踩的几个坑

1. 把“脚本网页化”误当平台化

有页面不代表有平台。
如果背后还是：

手工配环境
手工处理日志
手工判断失败
手工对接流程

那本质上只是“多了个页面入口”。

2. 平台和脚本边界不清

平台最容易写着写着变成：

什么逻辑都往平台里堆

这样后面会非常重，也很难维护。

3. 一开始做太全

这几乎是平台项目最常见的失控方式。

4. 只重执行，不重结果沉淀

很多平台能跑任务，但结果完全不成体系。
这种平台后期价值会很有限。

八、真实案例：为什么“脚本都能跑”之后，团队还是非做平台不可

场景

一个团队最开始已经有不少自动化脚本：

接口回归脚本
UI 回归脚本
生产巡检脚本

从单点能力看，其实并不差：

都能跑
也能出结果

执行

但随着任务量增加，问题开始集中爆发：

每套脚本执行方式都不同
新人不知道参数怎么配
定时任务分散在不同机器和 Jenkins 任务里
失败后日志、截图、报告分散在不同目录
一旦某个脚本负责人不在，团队接力成本很高

现象

表面上看，团队“已经有自动化”，但实际协作体验非常差：

同样一类问题每次都要重新解释
相同任务无法稳定复用
结果也很难沉淀成团队资产

排查

把这些问题往下拆后会发现，根因不是“脚本质量差”，而是系统层面缺了公共能力：

缺统一入口
缺统一执行
缺统一结果
缺统一环境和权限

也就是说，团队缺的已经不是更多脚本，而是承载这些脚本的公共系统。

修复

后面的平台化切入并不是一步做大，而是先收一条主链路：

统一任务入口
统一执行记录
统一结果和证据
再逐步接入 Jenkins、告警和更多任务类型

这个案例很能说明一点：

平台化往往不是因为“想做平台”，而是因为脚本阶段的组织成本已经开始超过脚本本身的价值。

九、怎么判断团队是不是已经到了该平台化的时候

如果下面这些现象开始反复出现，通常就说明平台化时机已经到了：

同类任务反复造轮子
多人协作接力成本很高
执行入口和结果口径极不统一
任务依赖某个“懂脚本的人”
脚本数量不少，但团队复用效率很低

这时候继续靠“再补几条脚本”通常解决不了根问题。

十、写在最后

从脚本到平台的演进，本质上不是技术栈升级，而是自动化能力组织方式的升级。

真正该问的从来不是：

能不能做一个平台

而是：

团队现在最痛的公共问题是什么
哪些脚本能力已经值得被平台接住
平台到底要把哪些重复成本真正吃掉

只要这几个问题想清楚，平台化就不会写成空概念，而会真正落到工程价值上。