多元统计分析04(多元正态分布的抽样分布)


目录

  • Chapter 4:多元正态分布的抽样分布
    • 一、正态变量二次型的分布
      • Part 1:分类独立的正态变量二次型
      • Part 2:一般情形的正态变量二次型
    • 二、Wishart分布
      • Part 1:Wishart分布的定义
      • Part 2:Wishart分布的性质
    • 三、Hotelling $T^2$ 分布
      • Part 1:Hotelling $T^2$ 分布的定义
      • Part 2:Hotelling $T^2$ 分布的性质
    • 四、Wilks $\Lambda$ 分布
      • Part 1:Wilks $\Lambda$ 分布的定义
      • Part 2:Wilks $\Lambda$ 分布的性质

Chapter 4:多元正态分布的抽样分布 一、正态变量二次型的分布 Part 1:分类独立的正态变量二次型
关于正态变量二次型的分布,首先考虑分量独立且同方差的情况。记 \(X=\left(X_1,X_2,\cdots,X_n\right)'\) 是一个正态随机向量,这里我们首先考虑 \(X\sim N_n\left(\mu,\sigma^2I_n\right)\) 的情况,其中 \(\mu=\left(\mu_1,\mu_2,\cdots,\mu_n\right)'\) 。
设非随机矩阵 \(A\) 是一个 \(n\times n\) 的对称矩阵,我们记 \(\xi=X'AX\) ,称为随机向量 \(X\) 的二次型。下面介绍若干正态随机向量二次型的性质。
结论 1:考虑 \(A=I_n\) 且 \(\mu=0\) 的情况,此时 \(\xi=X'X\) ,我们由 \(\chi^2\) 分布的定义可得

\[\frac{\xi}{\sigma^2}=\frac{1}{\sigma^2}X'X\sim\chi^2(n) \ . \]
结论 2:考虑 \(A=I_n\) 但 \(\mu\neq0\) 的情况,此时需要引入非中心 \(\chi^2\) 分布的定义。
如果 \(n\) 维正态随机向量 \(X\sim N(\mu,I_n)\) ,引入非中心参数 \(\delta\) ,满足

\[\delta=\mu'\mu=\sum_{i=1}^n\mu_i^2 \ , \]
则称 \(\xi=X'X\) 服从自由度为 \(n\) ,非中心参数为 \(\delta\) 的非中心 \(\chi^2\) 分布,记为 \(\xi\sim\chi^2(n,\delta)\) 。
如果 \(n\) 维正态随机向量 \(X\sim N\left(\mu,\sigma^2I_n\right)\) 且有 \(\sigma^2\neq1\) 时,令

\[Y_i=\frac{1}{\sigma}X_i\sim N\left(\frac{\mu}{\sigma},1\right) \ , \quad i=1,2,\cdots,n \ , \]
记 \(Y=\left(Y_1,Y_2\cdots,Y_n\right)'\) ,则有

\[Y'Y=\frac{1}{\sigma^2}X'X\sim\chi^2(n,\delta) \ , \quad \delta=\frac{1}{\sigma^2}\mu'\mu \ . \]
结论 3:考虑 \(A\neq I_n\) 但 \(\mu=0\) 的情况。
设 \(X\sim N_n\left(0,\sigma^2I_n\right)\) ,\(A\) 为 \(n\times n\) 对称矩阵且 \({\rm rank}(A)=r\) ,则

\[\frac{1}{\sigma^2}X'AX\sim\chi^2(r) \quad \iff \quad A^2=A \ . \]
结论 4:考虑 \(A\neq I_n\) 且 \(\mu\neq0\) 的情况。
设 \(X\sim N_n\left(\mu,\sigma^2I_n\right)\) ,\(A\) 为 \(n\times n\) 对称矩阵且 \({\rm rank}(A)=r\) ,记 \(\delta=\mu'A\mu/\sigma^2\) ,则

\[\frac{1}{\sigma^2}X'AX\sim\chi^2(r,\delta) \quad \iff \quad A^2=A \ . \]
这里我们只对结论 3进行证明。
\(\Longrightarrow\) :因为 \(A\) 是对称矩阵,所以存在正交阵 \(\Gamma\) ,使得

\[\Gamma'A\Gamma={\rm diag}\left(\lambda_1,\lambda_2,\cdots,\lambda_r,0,\cdots,0\right) \ . \]
令 \(Y=\Gamma'X\) ,则有 \(Y\sim N_n\left(0,\sigma^2I_n\right)\) 以及 \(X=\Gamma Y\) ,于是

\[\xi\xlongequal{def}\frac{1}{\sigma^2}X'AX=\frac{1}{\sigma^2}Y'\Gamma'A\Gamma Y=\frac{1}{\sigma^2}\sum_{i=1}^r\lambda_i Y_i^2 \ . \]
且 \(Y_1,Y_2,\cdots,Y_r\) 相互独立,同服从 \(N(0,\sigma^2)\) 分布。故 \(Y_i^2/\sigma^2\sim\chi^2(1)\ (i=1,2,\cdots,r)\) ,且相互独立。所以 \(\xi\) 的特征函数为

\[\varphi_\xi(t)=\prod_{i=1}^r\left(1-2i\lambda_it\right)^{-1/2} \ . \]
又因为已知 \(\xi\sim\chi^2(r)\) ,故 \(\xi\) 的特征函数为 \((1-2it)^{-r/2}\) 。利用

\[(1-2it)^{r/2}=\left[\prod_{i=1}^r\left(1-2i\lambda_it\right)\right]^{1/2} \ , \]
即可得出 \(\lambda_1=\lambda_2=\cdots=\lambda_r=1\) 的结论,于是

\[{\rm diag}\left(1,\cdots,1,0,\cdots,0\right)=\Gamma'A\Gamma=\Gamma'A\Gamma\cdot\Gamma'A\Gamma=\Gamma'A^2\Gamma \ . \]
故 \(A^2=A\) ,即 \(A\) 是对称幂等矩阵。
\(\Longleftarrow\) :因为 \(A\) 是对称幂等矩阵,而对称幂等矩阵的特征值非 \(0\) 即 \(1\) ,且只有 \(r\) 个非 \(0\) 特征值,即存在正交矩阵 \(\Gamma\) ,使得

\[\Gamma'A\Gamma=\begin{bmatrix} I_r & O \\ O & O \end{bmatrix} \ . \]
令 \(Y=\left(Y_1,Y_2,\cdots,Y_n\right)'=\Gamma'X\) ,即 \(X=\Gamma Y\) ,则有

\[Y\sim N_n\left(0,\sigma^2\Gamma'I_n\Gamma\right)=N_n\left(0,\sigma^2I_n\right) \ . \]
进而有

\[\frac{1}{\sigma^2}X'AX=\frac{1}{\sigma^2}Y'\Gamma'A\Gamma Y=\frac1{\sigma^2}Y'\begin{bmatrix} I_r & O \\ O & O \end{bmatrix} Y=\frac{1}{\sigma^2}\sum_{i=1}^rY_i^2 \ . \]
因为 \(Y_i\sim N\left(0,\sigma^2\right) \ (i=1,2,\cdots,r)\) 且相互独立,所以

\[\xi=\frac{1}{\sigma^2}X'AX=\frac{1}{\sigma^2}\sum_{i=1}^rY_i^2\sim\chi^2(r) \ . \]
关于正态随机向量的二次型和线性函数的独立性问题,还有以下两个结论。
结论 5:二次型与线性函数的独立性:设 \(X\sim N_n\left(\mu,\sigma^2I_n\right)\) ,\(A\) 是 \(n\times n\) 对称矩阵,\(B\) 是 \(m\times n\) 矩阵,则 \(BX\) 和 \(X'AX\) 相互独立的充分必要条件是 \(BA=O\) 。
结论 6:两个二次型的独立性:设 \(X\sim N_n\left(\mu,\sigma^2I_n\right)\) ,\(A\) 和 \(B\) 均是 \(n\times n\) 对称矩阵,则 \(X'AX\) 和 \(X'BX\) 相互独立的充分必要条件是 \(AB=O\) 。
Part 2:一般情形的正态变量二次型
关于一般情形的正态变量二次型的分布,记 \(X=\left(X_1,X_2,\cdots,X_p\right)'\) 是一个正态随机向量,这里我们主要考虑 \(X\sim N_p\left(\mu,\Sigma\right),\,\Sigma>0\) 的情况。这里我们要讨论的正态变量二次型的性质,和分量独立且同方差的情形类似,所以我们不再对 \(\mu\) 是否为 \(0\) 展开讨论,因此我们将一般情形的正态变量二次型的性质总结为以下三个结论。
结论 1:设 \(X\sim N_p\left(\mu,\Sigma\right),\,\Sigma>0\) ,则 \(X'\Sigma^{-1}X\sim\chi^2(p,\delta)\) ,其中 \(\delta=\mu'\Sigma^{-1}\mu\) 。
因为 \(\Sigma>0\) ,由正定矩阵的分解可得 \(\Sigma=CC'\) ,其中 \(C\) 为非退化方阵。
令 \(Y=C^{-1}X\) ,即 \(X=CY\) ,则有 \(Y\sim N_p\left(C^{-1}\mu,C^{-1}\Sigma\left(C^{-1}\right)'\right)\) 。
因为 \(\Sigma=CC'\) ,所以 \(Y\sim N_p\left(C^{-1}\mu,I_p\right)\) ,且有

\[X'\Sigma^{-1}X=Y'C'\Sigma^{-1}CY=Y'Y\sim\chi^2(p,\delta) \ . \]
其中,非中心参数为

\[\delta=\left(C^{-1}\mu\right)'\left(C^{-1}\mu\right)=\mu'\Sigma^{-1}\mu \ . \]
结论 2:设 \(X\sim N_p\left(\mu,\Sigma\right),\,\Sigma>0\) ,\(A\) 为 \(p\times p\) 的对称矩阵,且 \({\rm rank}(A)=r\) ,则有

\[(X-\mu)'A(X-\mu)\sim\chi^2(r) \quad \iff \quad \Sigma A\Sigma A\Sigma=\Sigma A\Sigma \ . \]
由 \(\Sigma>0\) 可知 \({\rm rank}(\Sigma)=p\) ,且存在正交矩阵 \(\Gamma\) 和 \(\lambda_i\ (i=1,2,\cdots,p)\) ,使得 \(\Sigma=\Sigma^{1/2}\cdot \Sigma^{1/2}\) ,其中

\[\Sigma^{1/2}=\Gamma{\rm diag}\left(\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_p}\right)\Gamma' \ . \]
将 \(\Sigma^{1/2}\) 称为 \(\Sigma\) 的平方根矩阵。记

\[\Sigma^{-1/2}=\Gamma{\rm diag}\left(\frac1{\sqrt{\lambda_1}},\frac1{\sqrt{\lambda_2}},\cdots,\frac1{\sqrt{\lambda_p}}\right)\Gamma' \ , \]
显然有 \(\Sigma^{1/2}\Sigma^{-1/2}=I_p\) 。令 \(Y=\Sigma^{-1/2}\left(X-\mu\right)\) ,则有

\[{\rm Var}(Y)=\Sigma^{-1/2}\Sigma\Sigma^{-1/2}=\Sigma^{-1/2}\Sigma^{1/2}\Sigma^{1/2}\Sigma^{-1/2}=I_p \ . \]
所以有 \(Y\sim N_p\left(0,I_p\right)\) ,且有

\[(X-\mu)'A(X-\mu)=Y'\Sigma^{1/2}A\Sigma^{1/2}Y\xlongequal{def}Y'CY \ . \]
其中 \(C=\Sigma^{1/2}A\Sigma^{1/2}\) ,且 \({\rm rank}(C)={\rm rank}(A)=r\) 。由分类独立的正态变量二次型的结论3可知

\[\begin{aligned} Y'CY\sim\chi^2(r) \quad & \iff \quad C^2=C \\ \\ &\iff \quad \Sigma^{1/2}A\Sigma^{1/2}\cdot\Sigma^{1/2}A\Sigma^{1/2}=\Sigma^{1/2}A\Sigma^{1/2} \\ \\ &\iff \quad \Sigma A\Sigma A\Sigma=\Sigma A\Sigma \ . \end{aligned} \]
结论 3:设 \(X\sim N_p\left(\mu,\Sigma\right),\,\Sigma>0\) ,\(A\) 和 \(B\) 为 \(p\times p\) 的对称矩阵,则二次型 \((X-\mu)'A(X-\mu)\) 与二次型 \((X-\mu)'B(X-\mu)\) 相互独立的充分必要条件为 \(\Sigma A\Sigma B\Sigma=O_{p\times p}\) 。
令 \(Y=\Sigma^{-1/2}(X-\mu)\sim N_p\left(0,I_p\right)\) ,则有

\[(X-\mu)'A(X-\mu)=Y'\Sigma^{1/2}A\Sigma^{1/2}Y \ ,\\ \\ (X-\mu)'B(X-\mu)=Y'\Sigma^{1/2}B\Sigma^{1/2}Y \ . \]
分类独立的正态变量二次型的结论6可知,\(Y'\Sigma^{1/2}A\Sigma^{1/2}Y\) 与 \(Y'\Sigma^{1/2}B\Sigma^{1/2}Y\) 相互独立的充分必要条件为

\[\Sigma^{1/2}A\Sigma^{1/2}\cdot\Sigma^{1/2}B\Sigma^{1/2}=O_{p\times p} \quad \iff \quad \Sigma A\Sigma B\Sigma=O_{p\times p} \ . \]
所以 \((X-\mu)'A(X-\mu)\) 与 \((X-\mu)'B(X-\mu)\) 相互独立的充分必要条件为 \(\Sigma A\Sigma B\Sigma=O_{p\times p}\) 。
二、Wishart分布 Part 1:Wishart分布的定义
Wishart分布是一元统计中 \(\chi^2\) 分布的推广,在多元正态总体 \(N_p(\mu,\Sigma)\) 的抽样分布中,Wishart分布常用来刻画样本离差阵的分布。这里我们用 \(n\times p\) 的矩阵 \(X=\left(X_{(1)},X_{(2)},\cdots,X_{(n)}\right)'\) 来表示随机样本数据阵。
Wishart分布:设 \(X_{(\alpha)}\sim N_p\left(0,\Sigma\right)\ (\alpha=1,2,\cdots,n)\) 相互独立,定义随机阵

\[W=\sum_{\alpha=1}^nX_{(\alpha)}X_{(\alpha)}'=X'X \ , \]
则称随机阵 \(W\) 的分布为Wishart分布,记为 \(W\sim W_p(n,\Sigma)\) 。
非中心Wishart分布:设 \(X_{(\alpha)}\sim N_p\left(\mu,\Sigma\right)\ (\alpha=1,2,\cdots,n)\) 相互独立,记

\[M=\begin{bmatrix} \mu_1 & \cdots & \mu_p \\ \vdots & & \vdots \\ \mu_1 & \cdots & \mu_p \end{bmatrix}=\boldsymbol1_n\mu' \ , \quad \Delta=M'M=n\mu\mu' \ . \]
则称 \(W=X'X\) 服从非中心参数为 \(\Delta\) 的非中心Wishart分布,记为 \(W\sim W_p(n,\Sigma,\Delta)\) 。
一般的非中心Wishart分布:设 \(X_{(\alpha)}\sim N_p\left(\mu_\alpha,\Sigma\right)\ (\alpha=1,2,\cdots,n)\) 相互独立,记

\[M=\begin{bmatrix} \mu_{11} & \cdots & \mu_{1p} \\ \vdots & & \vdots \\ \mu_{n1} & \cdots & \mu_{np} \end{bmatrix}=\begin{bmatrix} \mu_{1}'\\ \vdots \\ \mu_{n}' \end{bmatrix} \ , \quad \Delta=M'M=\sum_{\alpha=1}^n\mu_\alpha\mu_\alpha' \ . \]
则称 \(W=X'X\) 服从非中心参数为 \(\Delta\) 的非中心Wishart分布,记为 \(W\sim W_p(n,\Sigma,\Delta)\) 。
在保证抽取的随机样本肯定是同方差的前提下,区分Wishart分布是中心的还是非中心的,以及非中心参数的情况如何,关键在于随机样本是否来自于同一个多元正态总体,以及多元正态总体是否为零均值的。以上三种Wishart分布的非中心参数分别对应了三种不同情况:
  1. 若样本来自于一个零均值多元正态总体,则随机阵 \(W\) 服从中心Wishart分布;
  2. 若样本来自于一个非零均值多元正态总体,则随机阵 \(W\) 服从非中心Wishart分布;
  3. 若样本来自于多个均值不等的多元正态总体,则随机阵 \(W\) 服从一般的非中心Wishart分布。
对于服从Wishart分布的随机阵 \(W\sim W_p(n,\Sigma,\Delta)\) ,参数 \(p\) 称为随机阵 \(W\) 的阶数,参数 \(n\) 称为自由度,参数 \(\Sigma\) 对应于多元正态总体中的协方差阵。
Part 2:Wishart分布的性质
关于Wishart分布的性质,有一些结论不需掌握其证明,只需记忆并学会应用即可。
性质 1:设 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 是来自 \(p\) 元正态总体 \(N_p(\mu,\Sigma)\) 的简单随机样本,则样本离差阵 \(A\) 服从Wishart分布,即

\[A=\sum_{\alpha=1}^n\left(X_{(\alpha)}-\bar{X}\right)\left(X_{(\alpha)}-\bar{X}\right)'\sim W_p\left(n-1,\Sigma\right) \ . \]
性质 2:Wishart分布关于自由度 \(n\) 具有可加性:设随机阵 \(W_i\sim W_p\left(n_i,\Sigma\right)\ (i=1,2,\cdots,k)\) 且相互独立,则

\[\sum_{i=1}^kW_i\sim W_p(n,\Sigma) \ , \quad n=n_1+n_2+\cdots+n_k \ . \]
性质 3:Wishart分布具有可线性变换性:设随机阵 \(W\sim W_p(n,\Sigma)\) ,\(C\) 是 \(m\times p\) 常数矩阵,则

\[CWC'\sim W_m\left(n,C\Sigma C'\right) \ . \]
  • 特别地,取 \(C=\sqrt{a}I_p\) ,则有 \(aW\sim W_p\left(n,a\Sigma\right)\) ;
  • 特别地,取 \(C=l'=\left(l_1,l_2,\cdots,l_p\right)\) ,则有 \(\xi=l'Wl\sim W_1\left(n,l'\Sigma l\right)\) ,即

    \[\frac{\xi}{\sigma^2}=\frac{l'Wl}{\sigma^2}\sim\chi^2(n) \ , \quad \sigma^2=l'\Sigma l \ . \]
性质 4:分块Wishart分布:设 \(X_{(\alpha)}\sim N_p\left(0,\Sigma\right)\ (\alpha=1,2,\cdots,n)\) 相互独立,若协方差阵 \(\Sigma\) 和随机阵 \(W\) 可以按照如下形式分块:

\[\Sigma=\left[\begin{array}{c:c} \Sigma_{11} & \Sigma_{12} \\ \hdashline \Sigma_{21} & \Sigma_{22} \end{array}\right]\begin{array}{l} r \\ p-r \end{array} \ , \quad W=\left[\begin{array}{c:c} W_{11} & W_{12} \\ \hdashline W_{21} & W_{22} \end{array}\right]\begin{array}{l} r \\ p-r \end{array}\sim W_p(n,\Sigma) \ , \]
则有 \(W_{11}\sim W_r\left(n,\Sigma_{11}\right),\,W_{22}\sim W_{p-r}\left(n,\Sigma_{22}\right)\) ,且当 \(\Sigma_{12}=O\) 时,\(W_{11}\) 与 \(W_{22}\) 相互独立。
性质 5:条件Wishart分布:设随机阵 \(W\sim W_p(n,\Sigma)\) ,记 \(W_{22\cdot1}=W_{22}-W_{21}W_{11}^{-1}W_{12}\) ,则

\[W_{22\cdot1}\sim W_{p-r}\left(n-r,\Sigma_{22\cdot1}\right) \ , \]
其中 \(\Sigma_{22\cdot1}=\Sigma_{22}-\Sigma_{21}\Sigma_{11}^{-1}\Sigma_{12}\) ,且 \(W_{22\cdot1}\) 与 \(W_{11}\) 相互独立。
性质 6:Wishart分布的期望:设随机阵 \(W\sim W_p(n,\Sigma)\) ,则 \({\rm E}(W)=n\Sigma\) 。
性质 7:观测数据阵的二次型的分布:设 \(X\sim N_{n\times p}\left(M,I_n\otimes\Sigma \right)\) ,\(A\) 为 \(n\times n\) 的对称矩阵,则二次型 \(X'AX\sim W_p(r,\Sigma,\Delta)\) ,其中 \(\Delta=M'AM\) 的充分必要条件为 \(A^2=A\) 且 \({\rm rank}(A)=r\) 。
性质 8:观测数据阵的二次型的独立性:设 \(X\sim N_{n\times p}\left(M,I_n\otimes\Sigma \right)\) ,\(A\) 和 \(B\) 均 为 \(n\times n\) 的对称幂等矩阵,则二次型 \(X'AX\) 与 \(X'BX\) 相互独立的充分必要条件为 \(AB=O\) 。
三、Hotelling \(T^2\) 分布 Part 1:Hotelling \(T^2\) 分布的定义
Hotelling \(T^2\) 分布是一元统计中 \(t\) 分布的推广。在一元统计中,服从自由度为 \(n\) 的 \(t\) 分布的随机变量被定义为

\[t=\frac{X}{\sqrt{\xi/n}}\sim t(n) \ , \]
其中 \(X\sim N(0,1),\,\xi\sim\chi^2(n)\) 且 \(X\) 与 \(\xi\) 相互独立。如果我们考虑随机变量 \(t^2=nX^2/\xi\) 的分布,并将其推广到多元统计中,即可得到Hotelling \(T^2\) 分布的定义。
Hotelling \(T^2\) 分布:设 \(X\sim N_p\left(0,\Sigma\right)\) ,随机阵 \(W\sim W_p\left(n,\Sigma\right)\ (\Sigma>0,\,n\geq p)\) ,且 \(X\) 与 \(W\)? 相互独立,定义随机变量

\[T^2=nX'W^{-1}X \ , \]
则称随机变量 \(T^2\) 的分布为Hotelling \(T^2\) 分布,记为 \(T^2\sim T^2(p,n)\) 。
非中心Hotelling \(T^2\) 分布:设 \(X\sim N_p\left(\mu,\Sigma\right),\,\mu\neq0\) ,随机阵 \(W\sim W_p\left(n,\Sigma\right)\ (\Sigma>0,\,n\geq p)\) ,且 \(X\) 与 \(W\) 相互独立,定义随机变量

\[T^2=nX'W^{-1}X \ , \]
则称随机变量 \(T^2\) 的分布为非中心Hotelling \(T^2\) 分布,记为 \(T^2\sim T^2(p,n,\mu)\) 。
注意到,非中心Hotelling \(T^2\) 分布的非中心参数直接由正态随机向量的均值 \(\mu\) 指定,而非中心Wishart分布的非中心参数则是由定义的矩阵 \(\Delta=n\mu\mu'\) 指定。
此外,在定义Hotelling \(T^2\) 统计量时,虽然正态随机向量与Wishart随机阵都指定了矩阵参数 \(\Sigma\) ,但是在指定Hotelling \(T^2\) 统计量的参数时并没有出现,这说明Hotelling \(T^2\) 统计量的分布是与参数 \(\Sigma\) 无关的,这一点将作为Hotelling \(T^2\) 分布的性质进行证明。
Part 2:Hotelling \(T^2\) 分布的性质
关于Hotelling \(T^2\) 分布的性质,其结论也是以记忆和应用为主,不需掌握大量证明。
性质 1:设 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 是来自 \(p\) 元正态总体 \(N_p(\mu,\Sigma)\) 的简单随机样本,\(\bar{X}\) 和 \(A\) 分别是样本均值向量和样本离差阵,则统计量

\[\begin{aligned} T^2&=(n-1)\left[\sqrt{n}\left(\bar{X}-\mu\right)\right]'A^{-1}\left[\sqrt{n}\left(\bar{X}-\mu\right)\right] \\ \\ &=n(n-1)\left(\bar{X}-\mu\right)'A^{-1}\left(\bar{X}-\mu\right)\sim T^2(p,n-1) \ . \end{aligned} \]
样本均值向量 \(\bar{X}\) 和样本离差阵 \(A\) 的分布分别为

\[\bar{X}\sim N_p\left(\mu,\frac1n\Sigma\right) \ , \quad A\sim W_p(n-1,\Sigma) \ . \]
于是有

\[\sqrt{n}\left(\bar{X}-\mu\right)\sim N_p\left(0,\Sigma\right) \ . \]
又因为 \(\bar{X}\) 和 \(A\) 相互独立,所以 \(\sqrt{n}\left(\bar{X}-\mu\right)\) 和 \(A\) 相互独立。由Hotelling \(T^2\) 分布的定义可知,统计量 \(T^2\sim T^2(p,n-1)\) 。
性质 2:\(T^2\) 分布与 \(F\) 分布之间的关系:设 \(T^2\sim T^2(p,n)\) ,则

\[\frac{n-p+1}{np}T^2\sim F(p,n-p+1) \ . \]
性质 3:设 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 是来自 \(p\) 元正态总体 \(N_p(\mu,\Sigma)\) 的简单随机样本,\(\bar{X}\) 和 \(A\) 分别是样本均值向量和样本离差阵,定义统计量 \(T^2=n(n-1)\bar{X}'A^{-1}\bar{X}\) 则有

\[\frac{n-p}{n}\frac{T^2}{n-1}\sim F(p,n-p,\delta) \ . \]
其中 \(\delta=n\mu'\Sigma^{-1}\mu\) 为非中心 \(F\) 分布的非中心参数。
性质 4:\(T^2\) 统计量的分布只与 \(p\) 和 \(n\) 有关,与 \(\Sigma\) 无关。
设 \(U\sim N_p\left(0,I_p\right),\,W_0\sim W_p\left(n,I_p\right)\) 且 \(U\) 和 \(W_0\) 相互独立。
要证 \(T^2\) 统计量的分布与 \(\Sigma\) 无关,只要证对任何随机变量 \(T^2=nX'W^{-1}X\) ,都与标准正态随机向量 \(U\) 和对应的Wishart统计量 \(W_0\) 构成的 \(T^2\) 统计量 \(T_0^2=nU'W_0^{-1}U\) 同分布即可。
因为 \(X\sim N_p\left(0,\Sigma\right),\,W\sim W_p\left(n,\Sigma\right)\) ,则有 \(\Sigma^{-1/2}X\sim N_p\left(0,I_p\right)\) 且 \(\Sigma^{-1/2}W\Sigma^{-1/2}\sim W_p\left(n,I_p\right)\) ,故

\[U\xlongequal{d}\Sigma^{-1/2}X \ , \quad W_0\xlongequal{d}\Sigma^{-1/2}W\Sigma^{-1/2} \ . \]
所以有

\[T_0^2=nU'W_0^{-1}U\xlongequal{d}nX'W^{-1}X=T^2\sim T^2(p,n) \ . \]
性质 5:\(T^2\) 统计量对非退化变换不变:设 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) 是来自 \(p\) 元正态总体 \(N_p(\mu,\Sigma)\) 的简单随机样本,记 \(A_x\) 表示样本离差阵,则有

\[T_x^2=n(n-1)\left(\bar{X}-\mu\right)'A_x^{-1}\left(\bar{X}-\mu\right)\sim T^2(p,n-1) \ . \]
若存在 \(p\times p\) 的非退化常数矩阵 \(C\) 和 \(p\) 维常向量 \(d\) ,使 \(Y_{(\alpha)}=CX_{(\alpha)}+d,\,\alpha=1,2,\cdots,n\) ,则有

\[T_y^2=T_x^2\sim T^2(p,n-1) \ . \]
如果将 \(Y_{(\alpha)},\,\alpha=1,2,\cdots,n\) 写成数据阵的形式,注意到 \(Y=XC'+\boldsymbol1_pd'\) ,于是有

\[\bar{Y}=C\bar{X}+d \ , \quad A_y=CA_xC' \ . \]
于是

\[\begin{aligned} T_y^2&=n(n-1)\left(\bar{Y}-C\mu-d\right)'A_y^{-1}\left(\bar{Y}-C\mu-d\right) \\ \\ &=n(n-1)\left(\bar{X}-\mu\right)'C'\left(C'\right)^{-1}A_x^{-1}C^{-1}C\left(\bar{X}-\mu\right) \\ \\ &=T_x^2\sim T^2(p,n-1) \ . \end{aligned} \]
注意,这里的 \(T_y^2\) 和 \(T_x^2\) 是严格相等,而不仅仅是同分布。
四、Wilks \(\Lambda\) 分布 Part 1:Wilks \(\Lambda\) 分布的定义
Wilks \(\Lambda\) 分布是一元统计中 \(F\) 分布的推广,而 \(F\) 分布主要用于检验两个正态总体的方差比。在多元统计中,方差变成了协方差阵,不能直接作比,因此我们需要引入一个数值来描述对矩阵的离散程度的估计,所以我们引入了广义方差的概念。
广义方差:对于多元正态总体 \(X\sim N_p(\mu,\Sigma)\) ,我们将协方差阵的行列式 \(|\Sigma|\) 称为 \(X\) 的广义方差;对于来自多元正态总体的简单随机样本 \(X_{(\alpha)},\,\alpha=1,2,\cdots,n\) ,我们将 \(\left|\dfrac1nA\right|\) 或 \(\left|\dfrac1{n-1}A\right|\) 称为样本广义方差。
Wilks \(\Lambda\) 分布:设 \(A_1\sim W_p\left(n_1,\Sigma\right),\,A_2\sim W_p\left(n_2,\Sigma\right)\ (\Sigma>0,\,n_1\geq p,\,n_2\geq p)\) ,且 \(A_1\) 与 \(A_2\) 相互独立,定义广义方差之比为

\[\Lambda=\frac{\left|A_1\right|}{\left|A_1+A_2\right|} \ , \]
将 \(\Lambda\) 的分布称为Wilks分布,将 \(\Lambda\) 称为Wilks统计量或 \(\Lambda\) 统计量,记为 \(\Lambda\sim\Lambda(p,n_1,n_2)\) 。
特别地,当 \(p=1\) 时, \(\Lambda\) 统计量的分布正是一元统计中的Beta分布 \(\Beta(n_1/2,n_2/2)\) 。
Part 2:Wilks \(\Lambda\) 分布的性质
性质 1:当 \(n_2=1\) 时,设 \(n=n_1>p\) ,则有

\[\begin{aligned} &\Lambda(p,n,1)\xlongequal{d}\frac{1}{1+\dfrac{1}{n}T^2(p,n)} \ . \\ \\ &T^2(p,n)\xlongequal{d}n\cdot\frac{1-\Lambda(p,n,1)}{\Lambda(p,n,1)} \ . \\ \\ &\frac{n-p+1}{np}T^2(p,n)\xlongequal{d}\frac{n-p+1}{n}\frac{1-\Lambda(p,n,1)}{\Lambda(p,n,1)}\xlongequal{d}F(p,n-p+1) \ . \end{aligned} \]
性质 2:当 \(n_2=2\) 时,设 \(n=n_1>p\) ,则有

\[\frac{n-p+1}{p}\frac{1-\sqrt{\Lambda(p,n,2)}}{\sqrt{\Lambda(p,n,2)}}\xlongequal{d}F(2p,2(n-p+1)) \ . \]
性质 3:当 \(p=1\) 时,则有

\[\frac{n_1}{n_2}\frac{1-\Lambda\left(1,n_1,n_2\right)}{\Lambda\left(1,n_1,n_2\right)}\xlongequal{d} F\left(n_2,n_1\right) \ . \]
性质 4:当 \(p=2\) 时,则有

\[\frac{n_1-1}{n_2}\frac{1-\sqrt{\Lambda\left(2,n_1,n_2\right)}}{\sqrt{\Lambda\left(2,n_1,n_2\right)}}\xlongequal{d} F\left(2n_2,2(n_1-1)\right) \ . \]
性质 5:设 \(\Lambda\sim\Lambda\left(p,n_1,n_2\right)\) ,当 \(n_2>2,\,p>2\) 时,可以用 \(\chi^2\) 统计量作为 \(\Lambda\) 统计量的近似,即当 \(n_1\to\infty\) 时,有

\[-r\ln\Lambda\sim\chi^2\left(pn_2\right) \ , \quad r=n_1-\frac12\left(p-n_2+1\right) \ . \]
性质 6:若 \(\Lambda\sim\Lambda\left(p,n_1,n_2\right)\) ,则存在 \(B_k\sim\Beta\left(\dfrac{n_1-p+k}{2},\dfrac{n_2}{2}\right),\,k=1,2,\cdots,p\) 且相互独立,使得

\[\Lambda\xlongequal{d}B_1B_2\cdots B_p \ . \]
该性质说明 \(\Lambda\) 统计量可以看成若干个相互独立的 \(\Beta\) 统计量的乘积。
性质 7:若 \(n_2 ,则

\[\Lambda\left(p,n_1,n_2\right)\xlongequal{d}\Lambda\left(n_2,p,n_1+n_2-p\right) \ . \]
【多元统计分析04(多元正态分布的抽样分布)】该性质是一元统计中 \(F(n,m)\xlongequal{d}1/F(m,n)\) 的推广。

    推荐阅读