第三章平均数、标准差与变异系数 本章重点介绍平均数(mean)、标准差( standard deviation)与变异系数( variation coefficient)三个常用统计量,前者用于反映资料的集中性,即观测值以某一数值为中心而 分布的性质:后两者用于反映资料的离散性,即观测值离中分散变异的性质。 第一节平均数 平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位 置。在畜牧业、水产业生产实践和科学硏究中,平均数被广泛用来描述或比较各种技术措施 的效果、畜禽某些数量性状的指标等等。平均数主要包括有算术平均数( arithmetic mean) 中位数( median)、众数(mode)、几何平均数( geometric mean)及调和平均数( harmonic mean),现分别介绍如下 、算术平均数 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数 记为。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算 (一)直接法主要用于样本含量n≤30以下、未经分组资料平均数的计算 设某一资料包含n个观测值:x1、x、…、x,则样本平均数x可通过下式计算: x x1+x+…+x (3-1) n 其中,x为总和符号:∑x表示从第一个观测值x累加到第n个观测值x。当∑x 在意义上已明确时,可简写为Σx,(3-1)式即可改写为 【例3.1】某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585 00、480、510、505、490(kg),求其平均体重 由于∑x=500+520+535+560+585+600+480+510+505+490=5285,m=10 代入(3-1)式得 x5285 即10头种公牛平均体重为5285kg。 (二)加权法对于样本含量n≥30以上且已分组的资料,可以在次数分布表的基础 上采用加权法计算平均数,计算公式为:
22 第三章 平均数、标准差与变异系数 本章重点介绍平均数(mean)、标准差(standard deviation)与变异系数(variation coefficient)三个常用统计量,前者用于反映资料的集中性,即观测值以某一数值为中心而 分布的性质;后两者用于反映资料的离散性,即观测值离中分散变异的性质。 第一节 平均数 平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位 置。在畜牧业、水产业生产实践和科学研究中,平均数被广泛用来描述或比较各种技术措施 的效果、畜禽某些数量性状的指标等等。平均数主要包括有算术平均数(arithmetic mean)、 中位数(median)、众数(mode)、几何平均数(geometric mean)及调和平均数(harmonic mean),现分别介绍如下。 一、算术平均数 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数, 记为 x 。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。 (一)直接法 主要用于样本含量 n≤30 以下、未经分组资料平均数的计算。 设某一资料包含 n 个观测值:x1、x2、…、xn,则样本平均数 x 可通过下式计算: n x n x x x x n i i n = = + + + = 1 2 1 (3-1) 其中,Σ为总和符号; = n i i x 1 表示从第一个观测值 x1 累加到第 n 个观测值 xn。当 = n i i x 1 在意义上已明确时,可简写为Σx,(3-1)式即可改写为: n x x =∑ 【例 3.1】 某种公牛站测得 10 头成年公牛的体重分别为 500、520、535、560、585、 600、480、510、505、490(kg),求其平均体重。 由于Σx=500+520+535+560+585+600+480+510+505+490=5285,n=10 代入(3—1)式得: 528.5(kg) 10 ∑ 5285 = = = n x x 即 10 头种公牛平均体重为 528.5 kg。 (二)加权法 对于样本含量 n≥30 以上且已分组的资料,可以在次数分布表的基础 上采用加权法计算平均数,计算公式为:
f+1x2+… fr f+f2+…+fk (3-2) ∑f 式中:x,一第i组的组中值 f-第i组的次数 一分组数 第i组的次数后是权衡第i组组中值x在资料中所占比重大小的数量,因此f称为是x 的“权”,加权法也由此而得名 【例3.2】将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如 下,求其加权数平均数。 表3-1100头长白母猪仔猪一月窝重次数分布表 组中值(x) 次数(0 3 3 910 1350 24 1320 60 520 70 75 合计 100 4520 利用(3-2)式得 fx4520 100 即这100头长白母猪仔猪一月龄平均窝重为452kg 计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权 法计算 【例3.3】某牛群有黑白花奶牛1500头,其平均体重为750kg,而另一牛群有黑白 花奶牛1200头,平均体重为725kg,如果将这两个牛群混合在一起,其混合后平均体重为 多少? 此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛 群牛的头数为权,求两个牛群平均体重的加权平均数,即 fx750×1500+725×1200 =73889(kg) 2700 即两个牛群混合后平均体重为73889k (三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零
23 = = + + + + + + = = = f f x f f x f f f f x f x f x x k i i k i i i k k k 1 1 1 2 1 1 2 2 (3-2) 式中: i x —第 i 组的组中值; i f —第 i 组的次数; k —分组数 第 i 组的次数 fi 是权衡第 i 组组中值 xi 在资料中所占比重大小的数量,因此 fi 称为是 xi 的“权”,加权法也由此而得名。 【例 3.2】 将 100 头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如 下,求其加权数平均数。 表 3—1 100 头长白母猪仔猪一月窝重次数分布表 组别 组中值(x) 次数(f) f x 10— 15 3 45 20— 25 6 150 30— 35 26 910 40— 45 30 1350 50— 55 24 1320 60— 65 8 520 70— 75 3 225 合计 100 4520 利用(3—2)式得: 45.2( ) 100 4520 k g f fx x = = = 即这 100 头长白母猪仔猪一月龄平均窝重为 45.2kg。 计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权 法计算。 【例 3.3】 某牛群有黑白花奶牛 1500 头,其平均体重为 750 kg,而另一牛群有黑白 花奶牛 1200 头,平均体重为 725 kg,如果将这两个牛群混合在一起,其混合后平均体重为 多少? 此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛 群牛的头数为权,求两个牛群平均体重的加权平均数,即 738.89( ) 2700 750 1500 725 1200 k g f f x x = + = = 即两个牛群混合后平均体重为 738.89 kg。 (三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零
或简写成∑(x-x)=0 2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小 ∑(x-x)∑(x-a (常数a≠x) 或简写为:∑(x-x)2<∑(x-a) 以上两个性质可用代数方法予以证明,这里从略。 对于总体而言,通常用μ表示总体平均数,有限总体的平均数为 x (3-3) 式中,N表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏 估计量。统计学中常用样本平均数(x)作为总体平均数(μ)的估计量,并已证明样本平 均数是总体平均数μ的无偏估计量 中位数 将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为 Ma。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数简称中 数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方 法因资料是否分组而有所不同。 (一)未分组资料中位数的计算方法对于未分组资料,先将各观测值由小到大 依次排列 1、当观测值个数n为奇数时,(n+12位置的观测值,即xm+为中位数 Ma=x(n+)/2 2、当观测值个数为偶数时,n和(n2+1)位置的两个观测值之和的12为中 位数,即 2 【例3.4】观察得9只西农莎能奶山羊的妊娠天数为144、145、147、149、150、151 53、156、157,求其中位数。 此例m=9,为奇数,则 M=x(n+1)2=x9+)/2=xs=150(天) 即西农莎能奶山羊妊娠天数的中位数为150天, 【例3.5】某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为7、8、8、9、 ll、12、12、13、14、14天,求其中位数。 此例n=10,为偶数,则:
24 ( ) 0 1 − = = x x n i i 或简写成 (x − x) = 0 2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。 = n i 1 (xi- x ) 2< = n i 1 (xi- a) 2 (常数 a≠ x ) 或简写为: − 2 (x x) < − 2 (x ) 以上两个性质可用代数方法予以证明,这里从略。 对于总体而言,通常用μ表示总体平均数,有限总体的平均数为: x N n i i = = 1 (3-3) 式中,N 表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏 估计量。统计学中常用样本平均数( x )作为总体平均数(μ)的估计量,并已证明样本平 均数 x 是总体平均数μ的无偏估计量。 二、中位数 将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为 Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数简称中 数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方 法因资料是否分组而有所不同。 (一)未分组资料中位数的计算方法 对于未分组资料,先将各观测值由小到大 依次排列。 1、当观测值个数 n 为奇数时,(n+1)/2 位置的观测值,即 x(n+1)/2为中位数; Md= (n+1)/ 2 x 2、当观测值个数为偶数时,n/2 和(n/2+1)位置的两个观测值之和的 1/2 为中 位数,即: 2 / 2 + ( / 2+1) = n n d x x M (3-4) 【例 3.4】 观察得 9 只西农莎能奶山羊的妊娠天数为 144、145、147、149、150、151、 153、156、157,求其中位数。 此例 n=9,为奇数,则: Md= ( 1)/ 2 (9 1)/ 2 5 x x x n+ = + = =150(天) 即西农莎能奶山羊妊娠天数的中位数为 150 天。 【例 3.5】 某犬场发生犬瘟热,观察得 10 只仔犬发现症状到死亡分别为 7、8、8、9、 11、12、12、13、14、14 天,求其中位数。 此例 n=10,为偶数,则:
M,=2m/2+x(n/2+1)x5+x611+12 11.5(天) 即10只仔犬从发现症状到死亡天数的中位数为11.5天 (二)已分组资料中位数的计算方法若资料已分组,编制成次数分布表,则可 利用次数分布表来计算中位数,其计算公式为 n Md=l+=c 式中:L一中位数所在组的下限 一组距; f中位数所在组的次数; 总次数 c一小于中数所在组的累加次数。 【例3.6】某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表 如表3-2所示,求中位数。 表3—268头母牛从分娩到第一次发情间隔时间次数分布表 间隔时间(d) 头数( 累加头数 12-26 42-56 57-7l 72—86 16 87-101 102-116 ≥117 2 由表3-2可见:15,m=68,因而中位数只能在累加头数为36所对应的“57-71”这 一组,于是可确定L=57,户=20,C=16,代入公式(3-5)得 M=1+(2)=37+20(2-16)=703(天 即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。 三、几何平均数 n个观测值相乘之积开n次方所得的方根,称为几何平均数,记为G。它主要应用于畜 牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长 率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代 表其平均水平。其计算公式如下: (3-6) 为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得
25 11.5 2 11 12 2 2 / 2 ( / 2 1) 5 6 = + = + = + = x x + x x M n n d (天) 即 10 只仔犬从发现症状到死亡天数的中位数为 11.5 天。 (二)已分组资料中位数的计算方法 若资料已分组,编制成次数分布表,则可 利用次数分布表来计算中位数,其计算公式为: ) 2 ( c n f i M d = L + − (3—5) 式中:L—中位数所在组的下限; i—组距; f—中位数所在组的次数; n—总次数; c—小于中数所在组的累加次数。 【例 3.6】 某奶牛场 68 头健康母牛从分娩到第一次发情间隔时间整理成次数分布表 如表 3—2 所示,求中位数。 表 3—2 68 头母牛从分娩到第一次发情间隔时间次数分布表 间隔时间(d) 头数(f) 累加头数 12—26 1 1 27—41 2 3 42—56 13 16 57—71 20 36 72—86 16 52 87—101 12 64 102—116 2 66 ≥117 2 68 由表 3—2 可见:i=15,n=68,因而中位数只能在累加头数为 36 所对应的“57—71”这 一组,于是可确定 L=57,f=20,C=16,代入公式(3—5)得: 16) 70.5 2 68 ( 20 15 ) 57 2 = + ( − c = + − = n f i M d L (天) 即奶牛头胎分娩到第一次发情间隔时间的中位数为 70.5 天。 三、几何平均数 n 个观测值相乘之积开 n 次方所得的方根,称为几何平均数,记为 G。它主要应用于畜 牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长 率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代 表其平均水平。其计算公式如下: n n n n G x x x x x x x x 1 ( ) = 1 2 3 = 1 2 3 (3—6) 为了计算方便,可将各观测值取对数后相加除以 n,得 lgG,再求 lgG 的反对数,即得
G值,即 G=g[(gx1+gx2+…+gxn (3-7) 【例3.7】某波尔山羊群1997-2000年各年度的存栏数见表3-3,试求其年平均增 长率 表3-3某波尔山羊群各年度存栏数与增长率 年度 存栏数(只) 增长率(x) 140 280 0.400 0.398 2000 350 0.250 0.602 利用公式(3-7)求年平均增长率 g-t(gx1+lgx2+…+gxn) =g[(-0.368-0.398-0602) lgl(-0.456)=0.3501 即年平均增长率为0.3501或3501% 四、众数 资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M。如 表2-3所列的50枚受精种蛋出雏天数次数分布中,以22出现的次数最多,则该资料的众数 为22天。又如【例36】所列出的次数分布表中,57-71这一组次数最多,其组中值为64 天,则该资料的众数为64天 五、调和平均数 资料中各观测值倒数的算术平均数的倒数,称为调和平均数,记为H,即 H ∑¥ 调和平均数主要用于反映畜群不冋阶段的平均增长率或畜群不同规模的平均规模 【例3.8】某保种牛群不同世代牛群保种的规模分别为:0世代200头,1世代220 头,2世代210头;3世代190头,4世代210头,试求其平均规模 利用公式(3-9)求平均规模: 20833(头) 3(如+如+如10+1+20)3(024)00048
26 G 值,即 (lg lg lg )] 1 lg [ 1 2 1 n x x x n G = + + + − (3—7) 【例 3.7】 某波尔山羊群 1997—2000 年各年度的存栏数见表 3—3,试求其年平均增 长率。 表 3—3 某波尔山羊群各年度存栏数与增长率 年度 存栏数(只) 增长率(x) Lgx 1997 140 — — 1998 200 0.429 -0.368 1999 280 0.400 -0.398 2000 350 0.250 -0.602 Σlgx=-1.368 利用公式(3—7)求年平均增长率 G= (lg lg lg )] 1 lg [ 1 2 1 n x x x n + + + − =lg-1 [ 3 1 (-0.368-0.398–0.602)] =lg-1(-0.456)=0.3501 即年平均增长率为 0.3501 或 35.01%。 四、众 数 资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为 M0。如 表 2-3 所列的 50 枚受精种蛋出雏天数次数分布中,以 22 出现的次数最多,则该资料的众数 为 22 天。又如【例 3.6】所列出的次数分布表中,57—71 这一组次数最多,其组中值为 64 天,则该资料的众数为 64 天。 五、调和平均数 资料中各观测值倒数的算术平均数的倒数,称为调和平均数,记为 H,即 = + + = n x x xn n x H 1 1 1 1 1 1 1 ( ) 1 1 2 (3—8) 调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。 【例 3.8】 某保种牛群不同世代牛群保种的规模分别为:0 世代 200 头,1 世代 220 头,2 世代 210 头;3 世代 190 头,4 世代 210 头,试求其平均规模。 利用公式(3—9)求平均规模: 208.33 0.0048 1 (0.024) 1 ( ) 1 5 1 210 1 190 1 210 1 220 1 200 1 5 1 = = = + + + + H = (头)