第一章预备数学知识 多元质量控制涉及到多元数据的整理和统计推断等复杂内 容。因此,掌握相应的多元统计概念和方法是讨论多元质量控制问 题的必要前提。 众所周知,一元统计质量控制是建立在一元正态分布基础上 的;因为在现实世界中产品和服务质量特性的统计量(随机变量) 大都服从或近似服从一元正态分布,或者它们的某种形式的极限 分布是…元正态分布同样,多元统计质量控制是以多元正态分布 理论为基础的;因为在现实世界中产品和服务的多重质量特性的 统计量(随机向量)都服从或近似服从多元正态分布,其某种形式 的极限分布也是多元正态分布因此,本章先用较大篇幅来讨论多 元正态变量的一些特征及多元正态样本函数的一些性质;同时针 对后面章节的需要,还讨论在多元质量控制中常用的一些统计概 念和方法。 “L欲善其事,必先利其器。”建议对多元分析不够熟悉的读 者,务必先阅读本章介绍的预备数学知识,为顺利研究以后各章打 好基础。 下面依次介绍:随机向量及其矩;多元正态分布;多元样本矩; 多元总体的均值与协差阵估计;多元统计中常用的统计量及其分 布;多元正态性检验; Bonferroni不等式;剔除异常多元数据的 般方法。 第一节随机向量及其矩 在多元统计中我们研究的总体有p个指标,分别用随机变量 ,x2…,x。表示,写成向量形式,令X=(x1,…x)(其中“”表示
转置)则x即为p维随机向量。我们先介绍一般分布的随机向 量矩的定义及性质于研究多元正态分布要用矩阵因此也要介 绍本书后面用到的一些矩阵的知识 随机向量的矩及其性质 设X=(x1,x2,…x2)是p维随机向量设它的每个分量的均 值(数学期望)存在,即E(x;)=共,=1,2,…“p,定义随机向量X 的均值向量为 A1 E(x2) E(X)= (1.1) E(x1) 记E(X)=,P=(均,…p)’,称“为X的均值向量,它也是p维 如果随机向量X的每个分量的方差存在,D(x;)=G2=an,i 1,…p,这时任意二分量的协方差也存在,记COV(x,x)=0,i, 1,2,…,p,则定义随机向量X的协方差矩阵为 D(X)=E{〔X-E(X)〕〔X-E(X)]} D(x1) COV(I1,x2)".COV(I1,xp COV( D(x2) COV( OV( CoV c 12 (1.2) 记D(X)=Σ,它是p×p阶矩阵,简称协差阵。由定义知它是对称 注:在本书中,向量和矩阵一律用黑体;随机变量用大写体或小写体,其取值律 用小写体
矩阵,E=2,而且它是非负定矩阵 设 COV(T:,x D(x;)√D(x;) r,称为随机变量x;,x,的相关系数,且r,≤1。设 了1P R R称为向量X的相关系数矩阵,简称相关矩阵。由定义知R为对 称矩阵R=R,且非负定。 相关矩阵与协差矩阵有如下关系 R 或 R 下面介绍随机向量矩的一些运算性质。 我们知道随机变量的均值、方差有如下性质,设a为一常 数,则有 E(a)=aE(8) dCaF)=a D=aD()a 类似的性质对随机向量X的均值、协差阵也成立。 设A为m×p阶矩阵,则有 E(AX=AE(X) (1.6) 3
D(AX)=A(X)A' (1.7) (1.6)式很易验证,现证(1.7)式。设E(X)u,按定义 D(AX)= EC(AX- E(AX ))(AX- E(AX))) =E〔(AX-A)(AX-A口) =E〔A(X-u)(X-u)A〕 AEC(X-A(X- u)'A'=AD(X)A 二有关矩阵的一些知识 1.正定矩阵 任何随机向量,如果它的协方差矩阵存在,一定是对称的非负 定矩阵。因此学习多元统计需掌握正定矩阵的一些知识。 设A为一个p×p阶矩阵,如果对任何向量x=( x2)’,二次型 X'AX≥0 称A为非负定矩阵,如果只有当X=(0,…,0)时,上式等号才成 立,称A为正定矩阵。非负定矩阵记为A≥0,正定矩阵记作A>0。 我们限于介绍正定矩阵。 正定矩阵有下述性质 (1)A>0,存在正交矩阵厂(厂=F1)使 λ1 厂AT= 其中入>0,=1,…,,入是A的特征值 (2)A>0,存在可逆矩阵B,使 A=BB (1.9) 证明:由(1.8)式,令
则 A=(厂)-DD厂 =fDD厂 令B=「D,则 A=BB (3A>0,存在可逆矩阵C,且C>0,使 A=c (1.10) 证明,A=BB=DD=厂DFD1 令C=TD厂1,则 A=CC即A=C2 这时定义A2=C, (4)A>0,存在下三角矩阵B,使 A=BB (1.11) 证明:A=(a,)为正定矩阵,对任何X=(x1,…,x2) X′AX 可用配方法,把上式代为 十b2xp)2+( 十…+b2px2 )(b)(b;,)′ 11 其中B=(b;) b, 即为下三角矩阵