目录 第二章随机变量及其分布 进 21引言......·.. 道 2.2 随机变量的分布函数 iv 2.3常见的概率分布..... vi 2.3.1常见离散型分布 vi 2.3.2常见连续型分布 xi 2.4多维随机变量(随机向量)..· xiii 2.5条件分布和独立性···. xix 2.5.1条件分布..... xix 2.5.2随机变量的独立性 xxi 2.6随机变量的函数的分布.. xxii 27总结与讨论·.·..·· XXX 参考文献 ..。·.。.......Xxxi
8¹ 1Ÿ ëÅC˛9Ÿ©Ÿ iii 2.1 ⁄Û . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii 2.2 ëÅC˛©ŸºÍ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv 2.3 ~ÑV«©Ÿ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi 2.3.1 ~Ñl—.©Ÿ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi 2.3.2 ~ÑÎY.©Ÿ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi 2.4 ıëëÅC˛(ëÅï˛) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii 2.5 ^᩟⁄’·5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix 2.5.1 ^᩟ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix 2.5.2 ëÅC˛’·5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxi 2.6 ëÅC˛ºÍ©Ÿ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxii 2.7 o(Ü?ÿ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxx Ωz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xxxi i
第二章 随机变量及其分布 2.1引言 在很多试验中,处理一个汇总的变量要比处理原来的概率结构方便的多。例如在一次民意调 查中,我们调查50个人对某个事情的态度是支持(1)还是反对(0)。那么按照古典概型的处理方式, 所有可能的结果有20个,这是非常大的一个数字。但是如果我们用X={1的个数},则X的可能 取值为{0,1,·,50},这样处理起来就比原来的概率结构要方便多了, 假设我们随机投两枚骰子,根据两个骰子的点数和决定某个事情。则样本空间为 2={(,w2):w1,w2∈{1,2,3,4,5,6}} 但是我们其实只对点数和感兴趣,即对函数S:2→R的值感兴趣 S(w1,w2)=w1+w2, (w1,w2)∈2 S的可能值可以通过下表得到: W2 w1123456 1234567 2345678 3456789 45678910 567891011 6789101112 我们记事件 {S=k}={(w1,w2)∈2:w1+w2=k} 以及其概率为P(S=)
1Ÿ ëÅC˛9Ÿ©Ÿ 2.1 ⁄Û 3Èı£•ß?nòáÆoC˛á'?n5V«(êBı"~X3òg¨øN •ß·ÇN50á<È,áØú›¥|±(1)Ñ¥áÈ(0)"@oUÏ;V.?nê™ß §kåU(Jk2 50áߢ¥ö~åòáÍi"¥XJ·Ç^X={1áÍ}ßKXåU äè{0, 1, · · · , 50}ߢ?nÂ5“'5V«(áêBı . b·ÇëÅ›¸qfß䂸áf:Í⁄˚½,áØú"Kòmè Ω = {(ω1, ω2) : ω1, ω2 ∈ {1, 2, 3, 4, 5, 6}} ¥·ÇŸ¢êÈ:Í⁄a,ß=ȺÍS : Ω → Räa, S(ω1, ω2) = ω1 + ω2, (ω1, ω2) ∈ Ω SåUä屜LeL: ω2 ω1 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 10 5 6 7 8 9 10 11 6 7 8 9 10 11 12 ·ÇPØá {S = k} = {(ω1, ω2) ∈ Ω : ω1 + ω2 = k} ±9ŸV«èP(S = k). ii
又若我们是根据两个骰子的最大值决定,则映射 M(w1,w2)=max{w,w2},(w1,w2)∈2 类似可以由上表定出由M决定的事件及概率。象S,M这样的函数,我们称其为离散随机变 (discrete random variable). 定义2.1.l.一个随机变量(andom variable)是从样本空间2到实数轴的一个(映射)函数。具体的 讲,称样本空间2到实数轴R的一个映射X()为随机变量,如果 {w:X(w)<x}∈F 对任意的实数x∈R。X()经常简写为X. 例2.1.1.随机事件的示性函数是随机变量。 2.2 随机变量的分布函数 定义2.2.1.称 F(x)=P(X≤x),for all x∈R 为随机变量X的(累积)分布函数(cdf,cumulative distribution function,. 例2.2.1.投掷三枚硬币,X=正面向上的个数。则X的分布函数为 0j-∞<x<0 if0≤x<1 F(x)= if1≤x<2 if2≤x<3 1f3≤x<0∞ 分布函数F(x)满足: 1.iF()=0和m。F()=1 2.F(x)是一个非降的函数: 3.F(x)是一个右连续的函数,即对任意的xo有imF(x)=F(xo): ⅲ
qe·Ç¥ä‚¸áfÅåä˚½ßKN M(ω1, ω2) = max{ω1, ω2}, (ω1, ω2) ∈ Ω aqå±d˛L½—dM˚½Øá9V«"ñS, M˘ºÍ߷ǰŸèl—ëÅC ˛(discrete random variable). ½¬ 2.1.1. òáëÅC˛(random variable)¥lòmΩ¢Í¶òá(N)ºÍ"‰N ˘ß°òmΩ¢Í¶RòáNX(·)èëÅC˛ßXJ {ω : X(ω) < x} ∈ F È?ø¢Íx ∈ R"X(·)²~{èX. ~2.1.1. ëÅØá´5ºÍ¥ëÅC˛" 2.2 ëÅC˛©ŸºÍ ½¬ 2.2.1. ° F(x) = P(X ≤ x), for all x ∈ R èëÅC˛X(\»)©ŸºÍ(cdf, cumulative distribution function). ~2.2.1. ›ïnqM1, X=°ï˛áÍ"KX©ŸºÍè F(x) = 0 if − ∞ < x < 0 1 8 if 0 ≤ x < 1 1 2 if 1 ≤ x < 2 7 8 if 2 ≤ x < 3 1 if 3 ≤ x < ∞ ©ŸºÍF(x)˜v: 1. lim x→−∞ F(x) = 0⁄ lim x→+∞ F(x) = 1; 2. F(x)¥òáö¸ºÍ; 3. F(x)¥òámÎYºÍ, =È?øx0klim x↓x0 F(x) = F(x0). iii
反之,若一个函数满足1-3,则这个函数是一个分布函数。 证明3:对任意的xn↓xo,事件列An={X≤xn}为单调下降的,且有∩An={X≤xo}。 rn↓x0 从而有概率的上连续性立得。 根据随机变量取值的性质,我们主要考虑如下两类随机变量。 定义22.2.若随机变量X的所有可能取值为至多可列个点值,则称X为离散型随机变量。此时, 若记X的所有取值为{1,2,…},则称 P(X=xk)=pk;k=1,2;... 或者表示为 (也称此为密度阵) 为随机变量X的分布律概率函数、密度): 显然,概率函数满足 1.pk≥0,k=1,2,… 22账=1 k=1 3.F(x)=P(X≤x)=∑P(X=xk)=∑Pk tk<t 反之,若有一列实数{Pk}满足如上1-2两条,则存在某个随机变量使得{Pk}为其分布律。 按照定义,只有一个可能值的常数c是离散型随机变量,其概率函数为(份)。称之为退化分 布。 定义2.2.3.若存在非负函数f(c)使得随机变量X的分布函数 F(a)=f(a)dz,for all s 则称随机变量X为连续型的,并称f(x)为X的概率密度函数(pd5,probability density function)。 概率密度f(x)满足 iv
áÉ, eòáºÍ˜v1-3ßK˘áºÍ¥ò᩟ºÍ" y²3µÈ?øxn ↓ x0, ØáAn = {X ≤ xn}è¸Ne¸, Ök T xn↓x0 An = {X ≤ x0}" l kV«˛ÎY5·" ä‚ëÅC˛ä5üß·ÇÃáƒXe¸aëÅC˛" ½¬ 2.2.2. eëÅC˛X§kåUäèñıåá:äßK°Xèl—.ëÅC˛"dûß ePX §käè{x1, x2, · · · }ßK° P(X = xk) = pk, k = 1, 2, · · · ½ˆL´è x1 x2 · · · p1 p2 · · · ! (è°dèó› ) èëÅC˛X©ŸÆ(V«ºÍ!ó›). w,ßV«ºÍ˜v 1. pk ≥ 0, k = 1, 2, · · · 2. P∞ k=1 pk = 1 3. F(x) = P(X ≤ x) = P xk≤x P(X = xk) = P xk≤x pk áÉßekò¢Í{pk}˜vX˛1-2¸^ßK3,áëÅC˛¶{pk}蟩ŸÆ" UϽ¬ßêkòáåUä~Íc¥l—.ëÅC˛ßŸV«ºÍè c 1 "°ÉèÚz© Ÿ" ½¬ 2.2.3. e3öKºÍf(x)¶ëÅC˛X©ŸºÍ F(x) = Z x −∞ f(x)dx, for all x ∈ R K°ëÅC˛XèÎY.ßø°f(x)èXV«ó›ºÍ(pdf, probability density function)" V«ó›f(x)˜v iv
1.f(x)≥0,forall x∈R. 2.f()dz =1. 3.若f(x)在x点连续,则F(x)=f(x). 4.对任意的Borl可测集合B,P(X∈B)=∫eBf(r)dz 反之,若一个函数f(x)满足如上1-2两条,则存在某个连续型随机变量使得f(x)为其概率密 度。 以上连个定义也可以表述为 定义2.2.4.称随机变量X为连续型(continuous)的,如果它的分布函数是连续的:称随机变 量X为离散型(discrete)的,如果它的分布函数是一个阶梯函数。 既非连续也非离散的随机变量是存在的,比如 例2.2.2.设随机变量Y的分布函数为 F(y) ify<0 1-e e++efy之0 其中0<∈<1.则Y既不是连续的也不是离散的。 2.3 常见的概率分布 2.3.1常见离散型分布 1.0-1分布(Bernoulli distribution) 设随机变量X只取两个值,不妨记为0和1,而且P(X=1)=p=1-P(X=0)。其概率函数 为 或者表示成 P(X=)=p(1-p)1-i,i=0,1. (2.3.1) 则称X的分布为0-1分布并称X服从0-1分布。 在0-1分布中,常把X=1成为一个“成功”。随机变量的示性函数服从的就是0-1分布。 2.二项分布(Binomial distribution)
1. f(x) ≥ 0, forall x ∈ R. 2. R ∞ −∞ f(x)dx = 1. 3. ef(x)3x:ÎYßKF 0 (x) = f(x). 4. È?øBorelåˇ8‹B, P(X ∈ B) = R x∈B f(x)dx áÉßeòáºÍf(x)˜vX˛1-2¸^ßK3,áÎY.ëÅC˛¶f(x)èŸV«ó ›" ±˛ÎὬèå±L„è ½¬ 2.2.4. °ëÅC˛XèÎY.(continuous)ßXJß©ŸºÍ¥ÎY¶°ëÅC ˛Xèl—.(discrete)ßXJß©ŸºÍ¥òáFºÍ" QöÎYèöl—ëÅC˛¥3ß'X ~2.2.2. ëÅC˛Y ©ŸºÍè F(y) = ( 1− 1+e−y if y < 0 + 1− 1+e−y if y ≥ 0 Ÿ•0 < < 1. KY Qÿ¥ÎYèÿ¥l—" 2.3 ~ÑV«©Ÿ 2.3.1 ~Ñl—.©Ÿ 1. 0-1©Ÿ(Bernoulli distribution) ëÅC˛Xê¸áäßÿîPè0⁄1ß ÖP(X = 1) = p = 1 − P(X = 0)"ŸV«ºÍ è 0 1 1 − p p ! ½ˆL´§ P(X = i) = p i (1 − p) 1−i , i = 0, 1. (2.3.1) K°X©Ÿè0-1©Ÿø°X—l0-1©Ÿ" 30-1©Ÿ•ß~rX = 1§èòá“§ı”"ëÅC˛´5ºÍ—l“¥0-1©Ÿ" 2. 멟(Binomial distribution) v