大道至简 - 欲买桂花同载酒...

UI 自动化：Selenium 自动化测试的优缺点复盘

发表于 2022-02-18 分类于 UI自动化本文字数： 1.5k 阅读时长 ≈ 6 分钟

Selenium 这些年很容易被一句话概括掉：老、重、没有 Playwright 顺手。这个评价不完全错，但也太粗。更贴近实战的判断是，Selenium 的核心问题不是“不能做 UI 自动化”，而是它对工程纪律的要求高很多。等待写不好、页面分层做不好、失败留痕做不好，它就会显得特别脆；但如果项目已经基于它沉淀了大量资产，贸然推翻重写，也未必是最优解。所以我一直不把 Selenium 当成“应该立刻淘汰的老框架”，而是把它看成：在历史...

阅读全文 »

UI 自动化：UI 自动化到底适合哪些业务场景

发表于 2022-01-12 分类于 UI自动化本文字数： 2.1k 阅读时长 ≈ 8 分钟

第一次做 UI 自动化时，容易陷入一个非常自然但代价很高的误区：既然浏览器也能自动点，那就把所有核心功能都录进去、跑起来。结果往往是：第一版看起来很热闹第二个月开始大量修脚本第三个月团队开始说 UI 自动化不靠谱问题通常不在工具，而在场景选择。UI 自动化从来不是“能测的都测”，而是“哪些业务路径值得用最贵的验证方式去测”。因为和接口自动化相比，UI 自动化天然更慢、更脆、更依赖页面结构，也更依赖等待、账号、数据和浏览器环境。 ...

阅读全文 »

DevOps-06-测试平台与发布流水线协同时状态权限和报告怎么打通

发表于 2021-12-09 分类于 DevOps 本文字数： 4.9k 阅读时长 ≈ 18 分钟

在把测试平台接入发布流水线之后，最初看到的通常是效率收益：提测后可以自动触发回归合并后可以自动触发冒烟发布前可以自动执行关键校验失败后可以自动发通知但只要平台和流水线开始长期协同，真正的问题很快就会暴露出来：平台显示任务仍在执行，流水线却已经结束流水线已经放行，平台里的测试报告还停留在旧结果某个发布经理可以在流水线里点继续，却无法在平台里看到完整证据测试平台里把任务判成环境失败，流水线里却把同一次执行算成发布阻塞一次...

阅读全文 »

DevOps-05-测试团队接手CI-CD后最该先补哪些能力

发表于 2021-12-02 分类于 DevOps 本文字数： 3.5k 阅读时长 ≈ 13 分钟

在测试逐步平台化、自动化逐步接入交付链路之后，会遇到一个非常现实的变化： CI/CD 不再只是研发的发布工具，而开始变成质量门禁、环境校验、回归执行和结果收敛的主链路。一旦测试团队开始真正接手这条链路，最容易犯的错误不是技术不会，而是顺序错了。常见失控方式通常是这样的：先把大量测试脚本塞进流水线先追求全链路自动化先追求发布阻塞能力先追求覆盖率报表和大盘这些动作单看都没错，但如果能力底座没有先补齐，后面几乎一定会出...

阅读全文 »

DevOps-04-定时巡检构建任务和回归任务怎么分层治理

发表于 2021-11-25 分类于 DevOps 本文字数： 5.3k 阅读时长 ≈ 19 分钟

在把测试平台、Jenkins、定时巡检和发布回归逐步接起来之后，都会经历一个表面上很省事、后面却越来越乱的阶段：所有任务都做成 Jenkins Job 或统一流水线入口定时巡检和发布回归共用一套参数模板构建任务失败、回归失败、巡检失败都统一显示为一次流水线失败白天发布高峰和夜间巡检窗口共用同一批执行节点告警渠道不分类型，任何失败都直接推到同一个群这套方式最开始看起来没有问题，因为所有东西都能跑起来。但只要任务数量上来，治理...

阅读全文 »

DevOps-03-Jenkins-Pipeline怎么设计才不会越来越难维护

发表于 2021-11-18 分类于 DevOps 本文字数： 3.7k 阅读时长 ≈ 14 分钟

Jenkins Pipeline 在里都不是从设计开始失控的，而是从“先能跑起来”开始失控的。最初只有几个阶段，编译、测试、打包、部署看起来都不复杂。随着项目增多、环境增多、分支策略变化、测试链路加长、通知和回滚逻辑不断叠加，Pipeline 很容易从一条可读的交付链路，变成一大段难以理解、难以修改、难以复用的脚本集合。真正难维护的 Pipeline，通常不是功能不够，而是职责边界混乱。有人把环境判断塞进每个阶段，有人把业务参数和构...

阅读全文 »

DevOps-02-自动化测试接入CI-CD时最容易踩的8个坑

发表于 2021-11-11 分类于 DevOps 本文字数： 4.1k 阅读时长 ≈ 15 分钟

把自动化测试接入 CI/CD，最开始理解成下面这件事：代码提交后触发流水线流水线执行测试脚本失败了就阻塞发布这套理解并不算错，但它只覆盖了最表层的“能跑起来”。真正开始长期使用后，问题通常会集中暴露：流水线里能跑，本地却复现不了同一套测试脚本，白天稳定，晚上频繁误报构建时间越来越长，发布节奏越来越慢测试失败后没人能快速判断是代码问题、环境问题还是测试自身问题发布前明明做了自动化校验，线上还是出了本该被提前拦...

阅读全文 »

DevOps-01-Jenkins在测试平台回归和巡检里的分工边界怎么定

发表于 2021-11-04 分类于 DevOps 本文字数： 4.9k 阅读时长 ≈ 18 分钟

在把自动化测试、定时巡检和发布回归逐步接起来之后，最容易出现的一种局面是： Jenkins 既负责触发，又负责参数输入 Jenkins 既负责跑任务，又负责展示结果 Jenkins 既负责定时，又负责权限判断 Jenkins 既负责流水线，又负责告警通知短期看，这种方案很顺。因为只要把 Job 配起来，接口自动化、UI 回归、巡检脚本、发布前校验都能很快跑起来。但只要任务类型开始变多，问题会迅速积累：平台里看到的是一次“回归任务...

阅读全文 »

质量工程-07-测试负责人如何推动质量问题真正收敛

发表于 2021-10-28 分类于质量工程本文字数： 4.2k 阅读时长 ≈ 15 分钟

质量问题最容易出现一种假象：问题提出来了群里也同步了研发也回复会处理下一版看起来也修过了但过一段时间，同类问题又会以新的表现方式重新出现。这说明问题并没有真正收敛，只是被阶段性压下去了。测试负责人在这类场景里的职责，不是多开几次会，也不是把问题单催得更紧，而是把问题从“被发现”推进到“被验证修复、被纳入约束、被防止复发”。这篇文章只讨论一个核心问题：测试负责人如何从工程治理角度推动质量问题真正收敛，而不是长期停留在提单...

阅读全文 »

质量工程-06-监控、巡检、告警、回归怎么形成真实闭环

发表于 2021-10-21 分类于质量工程本文字数： 4.1k 阅读时长 ≈ 15 分钟

并不缺监控、巡检、告警和回归。真正缺的是把这四件事组织成一条可信的质量闭环。常见现场通常是这样的：监控平台能看到波动，但没人知道该不该拦版本巡检脚本每天都在跑，但失败后只能再看一次告警渠道接了很多，群消息却越来越没人看回归体系也存在，但和线上问题、巡检失败、历史高风险点并没有真正挂起来最后的结果是：问题被发现了，但没有被收敛问题被通知了，但没有被接住问题被修掉了，但没有进入长期防回归链路所以这篇文章不讨论“监控有没...

阅读全文 »