系統的性能和性能測試,是一個大家都知道其重要性卻往往容易忽略的事。為什么說容易忽略呢?很多系統,做性能測試的時間要么只在最初上線時,要么在重要的系統重構時。而日常的迭代更新、交易量的變化,不知誰才是壓倒系統的最后一根稻草。所以只要系統不下線,性能測試也只有進行時?;谶@樣一個出發點,我們構建了一個自動化性能測試系統,以便關注系統性能的變化。下面介紹一下在工作中的實踐。
自動化構建更新系統、測試、收集分析數據、發送報告。
需要進行三類測試:并發測試、壓力測試、負載測試。
需要得到指標:請求成功比例、tps、交易成功率、響應時間的均值和異常值比例、服務器的CPU和內存使用率。
處理“自動化”之外,還需要“簡單性”——可以不需要投入太多的人力進行開發,使用現成滿足需求的工具;“即時性”——新版本上線前后就能得到反饋。
2.1 測試過程
使用jenkins進行系統部署、觸發測試、觸發分析、發送報告。
第一步,設置jenkins定時,取每周的主干進行部署。
第二步,jenkins觸發測試工具執行測試。
第三步,jenkins觸發分析腳本,形成報告發送郵件。
2.2 工具
1)構建和觸發直接使用jenkins,設置定時,創建Job及Job之間的流程關系即可。
2)測試工具,提到過的測試工具tell,使用go的chan特性,很容易改寫為提供并發測試的工具。java中的testNG也是如此,當然你也可以使用你熟悉的工具。
3)分析腳本,一個是對tell的日志進行分析,一個是對數據庫的交易記錄進行分析,得到請求成功比例、tps、交易成功率、響應時間的均值和異常值比例。
4)最后jenkins自動把分析的結果郵件給你即可。而服務器的CPU和內存使用率直接使用阿里云的監控,需要到阿里云后臺查看。這里的不便,可以在阿里云上設置報警閾值和通知。當收到服務器報警時進行查看即可。
1-4的測試過程可以用下圖表示:
5)對于我們需要完成并發測試、壓力測試、負載測試這三類測試,需要設置三個不同的流程,執行不同的測試用例。jenkins流程如下圖所示:
2.4 定時執行
目前周四發布新版本,并發測試會在周四上線前,合并代碼后進行,測試通過后進行上線。周五進行壓力測試,周六至周一每天進行8小時的負載測試。
2.5 補充
交易模型:針對線上每周的交易數據變化,需要更新壓力和負載的交易模型。
數據庫量級:根據業務的運營階段,不知道商戶什么時候會突然放量,所以數據庫保持在比線上數據庫多50%的量。
服務器配置:盡量和生產一致。在目前的實踐中,測試服務器的配置和生產的配置完全一致,在應對需要緊急增加服務器時,會直接使用測試服務器。
原文轉自:http://www.jianshu.com/p/d987c2087aaa