AB测试结果分析
一、假设检验
根据样本(小流量)的观测结果,拒绝或接受关于总体(全部流量)的某个假设,称为假设检验。
假设检验的基本依据是小概率事件原理(小概率事件几乎不发生),如果小概率事件发生了,则有充分理由推翻原假设,否则接受原假设,检验的具体过程是:
-
首先假定原假设成立,并寻找一个原假设成立条件下的发生概率微小的事件,称为检验事件,对应的统计量称为检验统计量
-
其次是采集样本
-
最后观测步骤 1 所定义的小概率事件是否发生
-
- 若小概率事件发生,则拒绝原假设,接受备用假设
- 若小搞错了时间未发生,则接受原假设,拒绝备用假设
具体到AB实验中,涉及实验组和对照组组两个总体,假设实验的某个目标指标满足正态分布,实验组和对照组分别记为 X ∼ N ( μ 1 , σ 1 2 ) , Y ∼ N ( μ 2 , σ 2 2 ) X\sim \mathcal{N}(\mu_1, \sigma_1^2), Y \sim \mathcal{N}(\mu_2, \sigma_2^2) X∼N(μ1,σ12),Y∼N(μ2,σ22),常见检验问题是判断实验组对比对照组是否有效,具体又分为几类情况:
I. 原假设 H 0 : μ 1 ≤ μ 2 H_0: \mu_1\le \mu_2 H0:μ1≤μ2实验组对比对照组负向或无效;备用假设 H 1 : μ 1 > μ 2 H_1:\mu_1 > \mu_2 H1:μ1>μ2,实验组对比对照组正向
II. 原假设 H 0 : μ 1 ≥ μ 2 H_0:\mu_1\ge \mu_2 H0:μ1≥μ2实验对比对照组正向或无效;备用假设 H 1 : μ 1 < μ 2 H_1:\mu_1 < \mu_2 H1:μ1<μ2,实验组对比对照组负向
III. 原假设 H 0 : μ 1 = μ 2 H_0:\mu_1= \mu_2 H0:μ1=μ2实验对比对照组无效;备用假设 H 1 : μ 1 ≠ μ 2 H_1:\mu_1 \ne \mu_2 H1:μ1=μ2,实验有效,但未区分正向还是负向效果
与之等价的三个假设检验问题是:
I. 原假设 H 0 : μ 1 − μ 2 ≤ 0 H_0:\mu_1 - \mu_2 \le 0 H0:μ1−μ2≤0;备用假设 H 1 : μ 1 − μ 2 > 0 H_1:\mu_1 - \mu_2 > 0 H1:μ1−μ2>0
II. 原假设 H 0 : μ 1 − μ 2 ≥ 0 H_0:\mu_1- \mu_2\ge 0 H0:μ1−μ2≥0;备用假设 H 1 : μ 1 − μ 2 < 0 H_1:\mu_1 - \mu_2< 0 H1:μ1−μ2<0
III. 原假设 H 0 : μ 1 − μ 2 = 0 H_0:\mu_1- \mu_2 = 0 H0:μ1−μ2=0;备用假设 H 1 : μ 1 − μ 2 ≠ 0 H_1:\mu_1 - \mu_2 \ne 0 H1:μ1−μ2=0
如何寻找一个事件,满足在原假设成立条件下发生的概率微小 ?发生概率多小能满足要求 ?
第二个问题比较好回答,一般取 0.01 或 0.05,记为 α = 0.01 ∣ 0.05 \alpha = 0.01|0.05 α=0.01∣0.05,称为检验的显著性。第一个问题需要费一番推导。
以假设检验问题 I 为例,实验收集的样本记为 { X 1 , X 2 . . . , X n } , { Y 1 , Y 2 , . . . , Y 3 } \{X_1, X_2...,X_n\}, \{Y_1, Y_2, ..., Y_3\} {X1,X2...,Xn},{Y1,Y2,...,Y3}, 样本均值 X ‾ = ∑ i X i n , Y ‾ = ∑ i Y I m \overline{X} = \frac{\sum_i X_i}{n},\overline{Y} = \frac{\sum_iY_I}{m} X=n∑iXi,Y=m∑iYI分别总体均值 μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2的无偏相合估计,样本均值之差 X ‾ − Y ‾ \overline{X}-\overline{Y} X−Y是总体均值差 μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2的无偏相合估计,因此样本均值之差 X ‾ − Y ‾ \overline{X}-\overline{Y} X−Y大概率是分布在 μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2附近,直观思考,原假设成立的条件下, X ‾ − Y ‾ \overline{X}-\overline{Y} X−Y大概率落在非正数附近, X ‾ − Y ‾ \overline{X}-\overline{Y} X−Y取值为较大的正数的概率较小,如下图:
因此假设检验问题 I 原假设成立条件下的小概率事件定义为:$ {\overline{X}-\overline{Y} > c}$
下面需要做的是在给定小概率值 α \alpha α(也就是检验的显著性)的条件下确定阈值 c ,也就是满足不等式 P ( X ‾ − Y ‾ > c ) ≤ α P(\overline{X}-\overline{Y} > c) \le \alpha P(X−Y>c)≤α的实数 c.
由中心极限定理得到:
X ‾ ∼ N ( μ 1 , σ 1 2 / n ) Y ‾ ∼ N ( μ 2 , σ 2 2 / m ) \overline{X} \sim \mathcal{N}(\mu_1, \sigma_1^2/n)\\ \overline{Y} \sim \mathcal{N}(\mu_2, \sigma_2^2/m) X∼N(μ1,σ12/n)Y∼N(μ2,σ22/m)
为了确定阈值 c,需要分几种情况:
- 总体方差 σ 1 2 , σ 2 2 \sigma_1^2, \sigma_2^2 σ12,σ22已知
- 总体方差 σ 1 2 = σ 2 2 = σ 2 \sigma_1^2 = \sigma_2^2 = \sigma^2 σ12=σ22=σ2,且未知
- 总体方差 σ 1 2 ≠ σ 2 2 \sigma_1^2\ne\sigma_2^2 σ12=σ22,且未知
- 总体方差 σ 1 2 ≠ σ 2 2 \sigma_1^2\ne \sigma_2^2 σ12=σ22,且未知,大样本场景
首先考虑最简单的情况1, 由独立正态分布特性得到:
X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n + σ 2 2 m ) \overline{X}-\overline{Y} \sim \mathcal{N}(\mu_1 - \mu_2, \frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m} ) X−Y∼N(μ1−μ2,nσ12+mσ22)
( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n + σ 2 2 m ∼ N ( 0 , 1 ) \frac{(\overline{X}-\overline{Y}) - (\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} \sim \mathcal{N}(0, 1) nσ12+mσ22(X−Y)−(μ1−μ2)∼N(0,1): 正态分布性质
P ( ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n + σ 2 2 m > z α ) = α P(\frac{(\overline{X}-\overline{Y}) - (\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} > z_{\alpha}) =\alpha P(nσ12+mσ22(X−Y)−(μ1−μ2)>zα)=α : 由正态分布的上分位z_{\alpha}数定义
P H 0 ( X ‾ − Y ‾ σ 1 2 n + σ 2 2 m − μ 1 − μ 2 σ 1 2 n + σ 2 2 m > z α ) = α P_{H_0}(\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} - \frac{\mu_1-\mu_2}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} >z_{\alpha}) = \alpha PH0(nσ12+mσ22X−Y−nσ12+mσ22μ1−μ2>zα)=α
P H 0 ( X ‾ − Y ‾ σ 1 2 n + σ 2 2 m > z α + μ 1 − μ 2 σ 1 2 n + σ 2 2 m ) = α P_{H_0}(\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} >z_{\alpha} + \frac{\mu_1-\mu_2}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}}) = \alpha PH0(nσ12+mσ22X−Y>zα+nσ12+mσ22μ1−μ2)=α
P H 0 ( X ‾ − Y ‾ σ 1 2 n + σ 2 2 m > z α ) ≤ P H 0 ( X ‾ − Y ‾ σ 1 2 n + σ 2 2 m > z α + μ 1 − μ 2 σ 1 2 n + σ 2 2 m ) = α P_{H_0}(\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} >z_{\alpha}) \le P_{H_0}(\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} >z_{\alpha} + \frac{\mu_1-\mu_2}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}}) = \alpha PH0(nσ12+mσ22X−Y>zα)≤PH0(nσ12+mσ22X−Y>zα+nσ12+mσ22μ1−μ2)=α: 由事件和子事件概率关系
P H 0 ( X ‾ − Y ‾ > z α ∗ σ 1 2 n + σ 2 2 m ) ≤ α P_{H_0}(\overline{X}-\overline{Y} >z_{\alpha} * \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}) \le \alpha PH0(X−Y>zα∗nσ12+mσ22)≤α
c = z α ∗ σ 1 2 n + σ 2 2 m c = z_{\alpha} * \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}} c=zα∗nσ12+mσ22
概念整理:
-
检验显著性: α \alpha α
-
检验统计量:$Z= \overline{X}-\overline{Y} $
-
拒绝域: W I = { Z > z α ∗ σ 1 2 n + σ 2 2 m } W_I = \{ Z >z_{\alpha} * \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}\} WI={Z>zα∗nσ12+mσ22}
因为 { X ‾ − Y ‾ > z α ∗ σ 1 2 n + σ 2 2 m } \{\overline{X} - \overline{Y} > z_{\alpha} * \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}\} {X−Y>zα∗nσ12+mσ22}与 { X ‾ − Y ‾ σ 1 2 n + σ 2 2 m > z α } \{ \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} >z_{\alpha} \} {nσ12+mσ22X−Y>zα}是等价事件,因此检验问题 1 经常采用的
- 检验统计量是 u = X ‾ − Y ‾ σ 1 2 n + σ 2 2 m u = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} u=nσ12+mσ22X−Y
- 拒绝域为 W I = { u > z α } W_I = \{u > z_{\alpha}\} WI={u>zα}
p-value:
以检验问题 I 为例
在一个假设检验问题中,拒绝原假设的最小显著性水平成为 p 值。
X ‾ − Y ‾ ∼ N ( μ 1 − μ 2 , σ 1 2 n + σ 2 2 m ) \overline{X}-\overline{Y} \sim \mathcal{N}(\mu_1 - \mu_2, \frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m} ) X−Y∼N(μ1−μ2,nσ12+mσ22)
p = P ( T > X ‾ − T ‾ ) p= P(T > \overline{X} - \overline{T}) p=P(T>X−T)
利用p值和给定的显著性水平 α \alpha α:
- 若 α ≥ p \alpha \ge p α≥p,则拒绝原假设
- 若 α < p \alpha < p α<p,则接受原假设
p 值越小,拒绝原假设的理由越充分。
检验错误:
原假设实际成立但被拒绝的错误,称为 I 类错误,对应AB实验中推全了一个没有效果的实验,错误发生的概率记为 α \alpha α
原假设实际不成立但被接受的错误,称为 II 类错误,对应AB实验中一个有效果的实验没被推全,错误发生概率记为 β \beta β.
以上的检验过程保证原假设成立但被推翻的概率小于\alpha.
样本量一定的情况下,无法同事降低I类错误和II类错误的概率,一般通过保证 I 类错误不高于一个阈值的情况下,通过增大样本量,控制II错误概率。
最小样本量:
以检验问题 I 为例,考察接受原假设的概率:
P ( X ‾ − Y ‾ σ 1 2 n + σ 2 2 m < z α ) = P ( ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n + σ 2 2 m < z α − μ 1 − μ 2 σ 1 2 n + σ 2 2 m ) P(\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} < z_{\alpha}) = P(\frac{(\overline{X}-\overline{Y}) - (\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} < z_{\alpha} - \frac{\mu_1-\mu_2}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} ) P(nσ12+mσ22X−Y<zα)=P(nσ12+mσ22(X−Y)−(μ1−μ2)<zα−nσ12+mσ22μ1−μ2)
( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n + σ 2 2 m ∼ N ( 0 , 1 ) \frac{(\overline{X}-\overline{Y}) - (\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} \sim \mathcal{N}(0, 1) nσ12+mσ22(X−Y)−(μ1−μ2)∼N(0,1)
P ( ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n + σ 2 2 m < z α − μ 1 − μ 2 σ 1 2 n + σ 2 2 m ) = Φ ( z α − μ 1 − μ 2 σ 1 2 n + σ 2 2 m ) < β P(\frac{(\overline{X}-\overline{Y}) - (\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} < z_{\alpha} - \frac{\mu_1-\mu_2}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}}) = \Phi(z_{\alpha} - \frac{\mu_1-\mu_2}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}}) < \beta P(nσ12+mσ22(X−Y)−(μ1−μ2)<zα−nσ12+mσ22μ1−μ2)=Φ(zα−nσ12+mσ22μ1−μ2)<β
z α − μ 1 − μ 2 σ 1 2 n + σ 2 2 m < z 1 − β z_{\alpha} - \frac{\mu_1-\mu_2}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} < z_{1 - \beta} zα−nσ12+mσ22μ1−μ2<z1−β
假设 m = n
n > ( z α + z β ) σ 1 2 + σ 2 2 μ 1 − μ 2 ( 1 ) \sqrt{n} > \frac{(z_\alpha + z_\beta)\sqrt{\sigma_1^2 + \sigma^2_2}}{\mu_1 - \mu_2} \space\space\space\space\space\space(1) n>μ1−μ2(zα+zβ)σ12+σ22 (1)
启发:
-
指标总体的方差越大,需要的最小样本量越大
-
控制错误概率越低,需要的最小样本量越大,一般 α = 0.01 、 0.05 , β = 0.2 \alpha = 0.01、0.05, \beta = 0.2 α=0.01、0.05,β=0.2
-
实验组相对对照组提升 μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2越大,需要的样本量越小;提升越小,需要的最小样本量越大
-
- 当 μ 1 \mu_1 μ1从左侧无限接近 μ 2 \mu_2 μ2,所需要的最小样本量接近无限大
-
实验最短观测周期:T = ( z α + z β ) σ 1 2 + σ 2 2 μ 1 − μ 2 \frac{(z_\alpha + z_\beta)\sqrt{\sigma_1^2 + \sigma^2_2}}{\mu_1 - \mu_2} μ1−μ2(zα+zβ)σ12+σ22 / 单位时长累积样本数量
第2种情况,样本方差未知但相等:
s x 2 = 1 n − 1 ∑ ( x i − x ‾ ) 2 s y 2 = 1 m − 1 ∑ ( y i − y ‾ ) 2 s w 2 = ( n − 1 ) s x 2 + ( m − 1 ) s y 2 n + m − 2 s_x^2 = \frac{1}{n-1}\sum (x_i - \overline{x})^2 \\ s_y^2 = \frac{1}{m-1}\sum(y_i - \overline{y})^2 \\ s_w^2 = \frac{(n-1)s_x^2 + (m-1)s_y^2}{n+m-2} sx2=n−11∑(xi−x)2sy2=m−11∑(yi−y)2sw2=n+m−2(n−1)sx2+(m−1)sy2
( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) s w 1 n + 1 m ∼ t ( n + m − 2 ) \frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{s_w\sqrt{\frac{1}{n} + \frac{1}{m}}} \sim t(n + m - 2) swn1+m1(X−Y)−(μ1−μ2)∼t(n+m−2)
-
检验统计量: t = X ‾ − Y ‾ s w 1 n + 1 m t = \frac{\overline{X} - \overline{Y}}{s_w\sqrt{\frac{1}{n} + \frac{1}{m}}} t=swn1+m1X−Y
-
拒绝域: W I = { t > t 1 − α ( n + m − 2 ) } W_I = \{ t > t_{1-\alpha}(n + m- 2) \} WI={t>t1−α(n+m−2)}
第3中情况,样本样本方差未知,但不等
-
检验统计量: t = X ‾ − Y ‾ s x 2 n + s y 2 m t = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{s^2_x}{n} + \frac{s_y^2}{m}}} t=nsx2+msy2X−Y
-
拒绝域: W I = { t > t 1 − α ( l ) } l = ( s x 2 n + s y 2 m ) 2 / [ s x 4 n 2 ( n − 1 ) + s y 4 m 2 ( m − 1 ) ] W_I = \{ t > t_{1-\alpha}(l) \} \\ l = (\frac{s_x^2}{n} + \frac{s_y^2}{m})^2/[\frac{s_x^4}{n^2(n-1)} +\frac{s_y^4}{m^2(m-1)} ] WI={t>t1−α(l)}l=(nsx2+msy2)2/[n2(n−1)sx4+m2(m−1)sy4]
第4种情况,大样本情况
- 检验统计量: u = X ‾ − Y ‾ s x 2 n + s y 2 m u = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{s^2_x}{n} + \frac{s_y^2}{m}}} u=nsx2+msy2X−Y
- 拒绝域: W I = { u > z α } W_I = \{u > z_{\alpha}\} WI={u>zα}
二、区间估计
点估计不能提供估计参数的估计误差大小,所以点估计主要用在定性分析的场景,或在对总体参数要求不精确时使用,而在需要用精确总体参数的数据进行决策时则很少使用,这种场景主要使用区间估计。
第1种情况,总体方差已知:
( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n + σ 2 2 m ∼ N ( 0 , 1 ) \frac{(\overline{X}-\overline{Y}) - (\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} \sim \mathcal{N}(0, 1) nσ12+mσ22(X−Y)−(μ1−μ2)∼N(0,1)
P ( − z α / 2 ≤ ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) σ 1 2 n + σ 2 2 m ≤ z α / 2 ) = 1 − α P(-z_{\alpha/2}\le\frac{(\overline{X}-\overline{Y}) - (\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}} \le z_{\alpha/2}) = 1- \alpha P(−zα/2≤nσ12+mσ22(X−Y)−(μ1−μ2)≤zα/2)=1−α
P ( X ‾ − Y ‾ − z α / 2 ∗ σ 1 2 n + σ 2 2 m ≤ μ 1 − μ 2 ≤ X ‾ − Y ‾ + z α / 2 ∗ σ 1 2 n + σ 2 2 m ) = 1 − α P(\overline{X}-\overline{Y} - z_{\alpha/2} * \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}\le \mu_1-\mu_2\le \overline{X}-\overline{Y} + z_{\alpha/2} * \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}) = 1 - \alpha P(X−Y−zα/2∗nσ12+mσ22≤μ1−μ2≤X−Y+zα/2∗nσ12+mσ22)=1−α
- μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2的 1 − α 1 -\alpha 1−α置信区间 [ X ‾ − Y ‾ − z α / 2 ∗ σ 1 2 n + σ 2 2 m , X ‾ − Y ‾ + z α / 2 ∗ σ 1 2 n + σ 2 2 m ] [\overline{X}-\overline{Y} - z_{\alpha/2} * \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}, \overline{X}-\overline{Y} + z_{\alpha/2} * \sqrt{\frac{\sigma_1^2}{n} + \frac{\sigma_2^2}{m}}] [X−Y−zα/2∗nσ12+mσ22,X−Y+zα/2∗nσ12+mσ22]
第2种情况,总体方差未知但相等:
- μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2的 1 − α 1 -\alpha 1−α置信区间 [ X ‾ − Y ‾ − t 1 − α / 2 ( n + m − 2 ) ∗ s w ∗ 1 n + 1 m , X ‾ − Y ‾ + t 1 − α / 2 ( n + m − 2 ) ∗ s w ∗ 1 n + 1 m ] [\overline{X}-\overline{Y} - t_{1-\alpha/2}(n+m-2)*s_w * \sqrt{\frac{1}{n} + \frac{1}{m}}, \overline{X}-\overline{Y} + t_{1-\alpha/2}(n+m-2) *s_w* \sqrt{\frac{1}{n} + \frac{1}{m}}] [X−Y−t1−α/2(n+m−2)∗sw∗n1+m1,X−Y+t1−α/2(n+m−2)∗sw∗n1+m1]
第3种情况:
- μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2的 1 − α 1 -\alpha 1−α置信区间 [ X ‾ − Y ‾ − t 1 − α / 2 ( 1 ) ∗ s x 2 n + s y 2 m , X ‾ − Y ‾ + t 1 − α / 2 ( l ) ∗ s x 2 n + s y 2 m ] [\overline{X}-\overline{Y} - t_{1-\alpha/2}(1) * \sqrt{\frac{s_x^2}{n} + \frac{s_y^2}{m}}, \overline{X}-\overline{Y} + t_{1-\alpha/2}(l) * \sqrt{\frac{s_x^2}{n} + \frac{s_y^2}{m}}] [X−Y−t1−α/2(1)∗nsx2+msy2,X−Y+t1−α/2(l)∗nsx2+msy2]
第4种情况:
- μ 1 − μ 2 \mu_1 - \mu_2 μ1−μ2的 1 − α 1 -\alpha 1−α置信区间 [ X ‾ − Y ‾ − u 1 − α / 2 ∗ s x 2 n + s y 2 m , X ‾ − Y ‾ + u 1 − α / 2 ∗ s x 2 n + s y 2 m ] [\overline{X}-\overline{Y} - u_{1-\alpha/2} * \sqrt{\frac{s_x^2}{n} + \frac{s_y^2}{m}}, \overline{X}-\overline{Y} + u_{1-\alpha/2} * \sqrt{\frac{s_x^2}{n} + \frac{s_y^2}{m}}] [X−Y−u1−α/2∗nsx2+msy2,X−Y+u1−α/2∗nsx2+msy2]
三、区间估计与假设检验的关系
- 若检验显著水平 α \alpha α 拒绝域为W,则对立事件 W ‾ \overline{W} W就是相应参数的 1 − α 1 - \alpha 1−α置信区间
- W ‾ \overline{W} W为相应参数 1 − α 1 - \alpha 1−α置信区间,则对立事件W为检验显著水平 α \alpha α的拒绝域
四、更多
两个二项分布指标的分析
。。。
相关文章:
AB测试结果分析
一、假设检验 根据样本(小流量)的观测结果,拒绝或接受关于总体(全部流量)的某个假设,称为假设检验。 假设检验的基本依据是小概率事件原理(小概率事件几乎不发生),如果…...
Python模块和包:sys模块、os模块和变量函数的使用
文章目录 模块(module)引入外部模块引入部分内容包 (package)示例代码开箱即用sys模块sys.argvsys.modulessys.pathsys.platformsys.exit() os模块os.environos.system()os模块中的变量、函数和类 测试代码模块中的变量和函数的使用 总结:pyt…...
计算机软件工程毕业设计题目推荐
文章目录 0 简介1 如何选题2 最新软件工程毕设选题3 最后 0 简介 学长搜集分享最新的软件工程业专业毕设选题,难度适中,适合作为毕业设计,大家参考。 学长整理的题目标准: 相对容易工作量达标题目新颖 1 如何选题 最近非常多的…...
嵌入式学习笔记(25)串口通信的基本原理
三根通信线:Tx Rx GND (1)任何通信都要有信息作为传输载体,或者有线的或则无线的。 (2)串口通信时有线通信,是通过串口线来通信的。 (3)串口通信最少需要2根ÿ…...
c++学习第十三
1)循环引用的案例及解决办法: #include <iostream> #include <memory> using namespace std; class A;class B { public:B(){cout<<"B constructor---"<<endl;}~B(){cout<<"B deconstructor----"<<endl;}std::weak_…...
java复习-线程的同步和死锁
线程的同步和死锁 同步问题引出 当多个线程访问同一资源时,会出现不同步问题。比如当票贩子A(线程A)已经通过了“判断”,但由于网络延迟,暂未修改票数的间隔时间内,票贩子B(线程B)…...
Qt指示器设置
目录 1. 样式设置 2. 行为设置 3. 交互设置 创建一个进度指示器控件 在Qt中设置指示器(Indicator)的外观和行为通常需要操作相关部件的属性和样式表。以下是如何在Qt中设置指示器的一些常见方式: 1. 样式设置 你可以使用样式表…...
计算机网络第四节 数据链路层
一,引入数据链路层的目的 1.目的意义 数据链路层是体系结构中的第二层; 从发送端来讲,物理层可以将数据链路层交付下来的数据,装换成光,电信号发送到传输介质上了 从接收端来讲,物理层能将传输介质的光&…...
Vue.js not detected解决方法
扩展程序》管理扩展程序》详情》允许访问文件地址打开...
Window10安装PHP7.4
1. 下载PHP 7 首先需要下载PHP 7的安装包,可以从PHP官网(https://www.php.net/downloads.php)或者Windows下的PHP官网(http://windows.php.net/download/)下载Windows版本的PHP 7安装包。根据自己的系统架构ÿ…...
【C++刷题】二叉树进阶刷题
根据二叉树创建字符串 class Solution { public:/** ()的省略有两种情况* 1.左右都为空,省略* 2.左子树不为空,右子树为空,省略*/string tree2str(TreeNode* root){string s;if(root nullptr){return s;}s to_string(root->val);if(root…...
有效的数独
有效的数独 题目: 请你判断一个 9 x 9 的数独是否有效。只需要 根据以下规则 ,验证已经填入的数字是否有效即可。数字 1-9 在每一行只能出现一次。 数字 1-9 在每一列只能出现一次。 数字 1-9 在每一个以粗实线分隔的 3x3 宫内只能出现一次。示例 1: 输…...
Vue导航守卫beforeRouteEnter,beforeRouteUpdate,beforeRouteLeave
Vue导航守卫以我自己的理解就是监听页面进入,修改,和离开的功能。每个守卫接受三个参数 to: Route: 即将要进入的目标路由对象 from: Route: 当前导航正要离开的路由 next: Function: 一定要调用该方法来 resolve 这个钩子。执行效果依赖 next 方法的调用参数。 next(): 进行…...
小红书《乡村振兴战略下传统村落文化旅游设计》中南大许少辉八一新著
小红书《乡村振兴战略下传统村落文化旅游设计》中南大许少辉八一新著...
Android13 下拉菜单栏中添加快捷截图按钮
Android 13 原生系统下拉状态栏中是没有快捷截图按钮,现在需要添加快捷截图功能。 添加快捷截图功能后的效果图: 涉及修改的文件如下: modified: vendor/mediatek/proprietary/packages/apps/SystemUI/res/values/config.xml modified: vendor/mediatek/proprietary/…...
GFS文件系统
GFS 分布式文件系统 GlusterFS简介 GlusterFS 是一个开源的分布式文件系统。 由存储服务器、客户端以及NFS/Samba 存储网关(可选,根据需要选择使用)组成。 没有元数据服务器组件,这有助于提升整个系统的性能、可靠性和稳定性。 …...
22 相交链表
相交链表 题解1 快慢双指针改进 (acb bca)题解2 哈希表(偷懒) 给你两个单链表的头节点 headA 和 headB ,请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点,返回 null 。 题目数据 保证 整个链式结构中不存在环。 注意ÿ…...
简历(快速上手)
简历 文章目录 简历简历模板:排版上:内容上:沟通上: 简历在面试中起到关键作用 网申,HR只会花10秒多来看一下 内推,如果简历没优势就只能pass 简历模板: ⽊及简历(推荐! ) : https://resume.mdedit.online 排版上: 尽量简洁,…...
wpf复制xaml及其cs窗体到其他项目 添加现有项,选 .xaml.cs,点添加即可。VS2022
添加现有项,选 LoadingWindow.xaml.cs,点添加即可。...
在线旅游平台步入新时代,携程如何走出自己的路?
今年旅游从线下到线上全方位火了。有统计数据,一季度,光是抖音,旅游达人发布视频数量就高达175万条,播放量1350亿次,收获27亿次点赞。在这一趋势下,许多“不出名”的景区和酒店借势抖音达人完成“出圈”。短…...
java中feign远程调用底层是用Hystrix作为熔断器吗?
在较新的版本中,Feign 默认使用 OpenFeign 作为远程调用的底层实现,并且集成了 Netflix Hystrix 作为熔断器。然而,需要注意的是,自 Feign 10.x 版本开始,默认已不再集成 Hystrix。 在 Feign 中,Hystrix 被…...
Web安全——穷举爆破下篇(仅供学习)
Web安全 一、常见的端口服务穷举1、hydra 密码穷举工具的使用2、使用 hydra 穷举 ssh 服务3、使用 hydra 穷举 ftp 服务4、使用 hydra 穷举 mysql 服务5、使用 hydra 穷举 smb 服务6、使用 hydra 穷举 http 服务7、使用 hydra 穷举 pop3 服务8、使用 hydra 穷举 rdp 服务9、使用…...
强大的JTAG边界扫描(5):FPGA边界扫描应用
文章目录 1. 获取芯片的BSDL文件2. 硬件连接3. 边界扫描测试4. 总结 上一篇文章,介绍了基于STM32F103的JTAG边界扫描应用,演示了TopJTAG Probe软件的应用,以及边界扫描的基本功能。本文介绍基于Xilinx FPGA的边界扫描应用,两者几乎…...
苍穹外卖集成 Apache POI Java实现Excel文件的读写下载
苍穹外卖 day12 Echats 营业台数据可视化整合_软工菜鸡的博客-CSDN博客 Apache POI - the Java API for Microsoft Documents Project News 16 September 2022 - POI 5.2.3 available The Apache POI team is pleased to announce the release of 5.2.3. Several dependencies …...
iOS逆向:工具安装
二〇二三年〇八月二十三日(2023版,iOS逆向笔记) 对其他APP的实现感兴趣,对技术报以热枕,不去做违反职业道德和违法乱纪的事情,欢迎来到iOS逆向。 工欲善其事必先利其器 ------我说的。 网络不好可配置DNS 1…...
十种数据库缓存相关的技术和机制
数据库的缓存 -- 通过将数据库中的数据或结果集保存在内存或其他快速访问的介质中,能够加快查询响应,减少对磁盘或远程服务器的访问,降低资源消耗。 根据缓存的位置、内容、粒度、更新方式等不同,数据库缓存技术有多种类型和策略。…...
【C++】封装unordered_map和unordered_set(用哈希桶实现)
前言: 前面我们学习了unordered_map和unordered_set容器,比较了他们和map、set的查找效率,我们发现他们的效率比map、set高,进而我们研究他们的底层是由哈希实现。哈希是一种直接映射的方式,所以查找的效率很快…...
面试问题回忆
(1)查看端口 lsof -i:8080 / netstat lsof -i:8080:查看8080端口占用 lsof abc.txt:显示开启文件abc.txt的进程 lsof -c abc:显示abc进程现在打开的文件 lsof -c -p 1234:列出进程号为1234的进程所打开…...
更多场景、更多选择,Milvus 新消息队列 NATS 了解一下
在 Milvus 的云原生架构中,消息队列(Log Broker)可谓任重道远,它不仅要具备流式数据持久性、支持 TT 同步、事件通知等能力,还要确保工作节点从系统崩溃中恢复时增量数据的完整性。 在 Milvus 的架构中,一切…...
如何通过python实现一个web自动化测试框架?
要实现一个web自动化测试框架,可以使用Python中的Selenium库,它是最流行的Web应用程序测试框架之一。以下是一个基本的PythonSelenium测试框架的示例: 1、安装Selenium 在终端中输入以下命令,使用 pip 安装 Selenium:…...
南宁建站网站模板/百度app免费下载安装最新版
链路状态报文LSP(Link State PDUs)用于交换链路状态信息。LSP分为两种:Level-1 LSP和Level-2 LSP。Level-1 LSP由Level-1 IS-IS传送,Level-2 LSP由Level-2 IS-IS传送,Level-1-2 IS-IS则可传送以上两种LSP。LSP报文中主…...
小挑可以做网站吗/一站式营销推广
4.1 问题 本例要求学会配置zabbix被控机,降低环境复杂度起见,可以将主控机zbx.tedu.cn同时也配置成被控机,完成下列任务。 确认已安装zabbix-agent软件包 调整配置,允许主控机192.168.10.7采集数据 启动zabbix-agent被控服务4.2…...
名字做头诗的网站/优化设计答案大全英语
MTU是Maximum Transmission Unit的缩写。意思是网络上传送的最大数据包。 大部分网络设备的MTU都是1500。如果本机的MTU比网关的MTU大,大的数据包就会被拆开来传送,这样会产生很多数据包碎片,增加丢包率,降低网络速度。把本机的MT…...
做住宿网站挣钱吗/南宁seo怎么做优化团队
概要schemachangesetstructmap总结概要 Ecto 中, 对数据库的操作中经常用到 4 个类型: schemachangesetstructmap在 Ecto 的 API 中, 基本都是都是对这 4 个类型的操作, 这 4 个类型的关系和互相转换弄清楚, 有助于更好的使用 Ecto 的 API. schema schema 定义了数据库中表的结…...
jsp网站 值班功能/制作一个网站的费用是多少
嵌入式系统是指在特定应用领域内为满足特定要求而设计的计算机系统,通常被嵌入到设备中,具有实时性、可靠性、低功耗等特点。嵌入式系统应用广泛,例如:智能家居、智能手表、汽车控制系统、医疗设备等。 在本篇博客中,…...
兰州做网站公司有哪些/百度站长工具链接提交
一、类的继承与对象的原型继承: JavsScript不存在“类”的概念,都是“对象”。Java中如果想拥有某个类的属性和方法,需要使用extends关键字继承这个类。但是JavaScript不同于Java中的类的继承,如果想拥有像某个对象的属性和方法&a…...