一種常見的AB測試誤區分析(3)_軟件測試工程師入門

劉慈欣談ChatGPT：人類的無能反而

OpenAI 因使用“竊取”的個人數據

搜狐回應員工遭遇工資補助詐騙：

軟件測試 > 測試技術 > 軟件測試工程師入門 >

一種常見的AB測試誤區分析(3)

發表于：2017-01-13來源：吆喝科技作者：吆喝科技點擊數：標簽：AB測試

2次 2.2% 3次 1.8% 5次 1.4% 10次 1.0% 看一下自己犯了多大的錯誤，如果你在AB測試過程中不時的查看統計結果并快速的做決定，上面的表格會讓你起雞皮疙瘩。

2次 2.2%
3次 1.8%
5次 1.4%
10次 1.0%

看一下自己犯了多大的錯誤，如果你在AB測試過程中不時的查看統計結果并快速的做決定，上面的表格會讓你起雞皮疙瘩。

應該如何做

避免重復檢驗顯著性錯誤的最好方式就是不去重復的檢驗顯著性。事先決定樣本數量，等試驗結束后再去AB測試軟件中查看“優于原版本的概率”。如果你能抑制提前結束試驗的想法，那中途偷窺數據也無妨。這有些反人性，所以最佳建議還是不要偷窺。

既然要事先決定樣本數量，應該取多少呢？下面是經驗公式：

δ是能檢測到的最小變化，σ是樣本的標準差。樣本的標準差可能不好預知，但是如果參與計算的樣本取值是2值的（比如統計轉化率），則有：

保證樣本的規模就能避免問題。
對AB測試軟件的建議：在試驗結束之前不要報告顯著性水平，不要用顯著性水平來決定是繼續試驗還是停止試驗。試驗進行中不報告顯著性水平而是報告目前樣本數量能檢測出多大的差別，計算公式為：

原文轉自：http://www.appadhoc.com/blog/a-mistake-analysis-of-abtesting/

軟件測試 > 測試技術 > 軟件測試工程師入門 >

一種常見的AB測試誤區分析(3)

應該如何做

相關文章

全網最詳細的接口測試實戰

先測試再開發？TDD測試驅動

自動化測試架構

軟件測試架構師的知識能力

大數據平臺測試方法

用不同的測試模型來構建測

當軟件測試遇上ChatGPT：軟件

軟件測試用例評審說明

全網最詳細的接口測試實戰

先測試再開發？TDD測試驅動

自動化測試架構

軟件測試架構師的知識能力

大數據平臺測試方法

用不同的測試模型來構建測

當軟件測試遇上ChatGPT：軟件

軟件測試用例評審說明

MBT基于模型的測試介紹資料

iso29119相關介紹性資料

HP QTP 10 中文版官方中文補丁

HP QTP 10 英文版下載地址

HP ALM 11 官方中文版下載地址

Quality Center 9.0中文版下載地

HttpWatch Basic Edition Version 7.

WIN2003+ORACLE11G+QC11(ALM11) 安裝

WIN2003+SQL2005(SP3)+QC11(ALM11) 安

軟件測試沙龍 More>>

新浪微博 More>>

熱門標簽

《測試團隊的招聘與管理

《我們應該如何構建我們

軟件測試 > 測試技術 > 軟件測試工程師入門 >

一種常見的AB測試誤區分析(3)

應該如何做