新乡医学院学院教案首页 课程名称 卫生统计学 授课题目 计算器的使用,数值变量资料的统计描述 授课对象 2014级各专业 1.计算器统计功能键的使用方法 20分钟 2.复习理论误相关内容 20分钟 时间分配 ①频数表的编制(5分钟) ②定量资料集中趋势和离散趋势指标(15分钟) 3.练习 80分钟 合计:120分钟 课时目标 1.掌握定量资料集中趋势和离散趋势指标的计算和应用 2.熟悉参考值范围的计算方法 授课重点 1.定量资料集中趋势和离散趋势指标的计算和应用 2.医学参考值范围的确定 授课难点 1.标准差计算及应用 2.频数表法计算百分位数 授课形式 小班实验课教学 授课方法 讲授、练习 参考文献 1.《流行病学与医学统计学》段广才主编 2.《卫生统计学》(第7版)方积乾主编 思考题 组计量资料,各个变量都加上一个常数a,均数和标准差如何变化? 教研室主任 教研室主任(签字) 课程负责人(签字) 及课程负责 人签字 月 日 年月日
教紧续页 教学组织与 讲义内容 计量资料(数值变量资料):测量每一个观察单位的某项指 教学安排 让学生零植什量贵 标的量的大小,所得的数据资料。特点:有度量衡单位、多为连续料機念,零雄频数 性资料。比如:身高、体重等。 表的编刺 当计量资料的样本含量较小时,可直接观察其数量特征和分布 规律 选择适当的指标进行统计分析。当样本含量较大时,很难 接发现其数据特征和频数的分布规律,则需要通过编制频数表对原 始资料进行整理。 (一)频数表(frequency distribution table)(须数:数据的个 将3 及提同的学生,如 (①)频数表的编制 学生的印象。 ①计算极 (range),又称全距:R=Xa一x ②决定组数、组距: 确定组数,一般8~15组,常取10组。组数不宜过多,也不 能太少,太少看不出数据分布的规律。 组距i:i=R/n(R/I0),再调整i,便于分组和计算 ③确定各组段上下限 第 一组段包 最小值,最后组 没包括最大值 注意:每个组段包含该组段的下限值,不包含本组段的上限值,最 后一个组段要标出上下限。 ④列表划记统计各组段内的数据个数(频数),可划“正”:并计算 频率、累计频数、累计频率。 (2)频数分布的两个特征:集中趋势(central tendency).与离散趋势 分各指标 (tendency of dispersion, (3)频数分布的类型:对称分布(正态分布、近似正态分布)与偏态 分布(集中位置偏向左的一侧叫正偏态,反之叫负偏态。进行描述 性统计时,对资料的不同分布类型,应选择不同的统计指标。 4)频数表的主要用徐, 布类型 ③发现某些特大和特小的可疑值 ④便于进一步选择指标与分析计算 (二)描述集中趋势的统计指标:常用平均数(average)来描述。 如算术均数, 几何均数,中位数等。 )算术均数(均数)(arithmetic mean) ①意义:一组观察值在数量上的平均水平。 ②表示:μ(总体) 元(样本) ③计算:直接法 加权法(weighing method).:(x为组中值)》 等 ④应用:资料呈现正态或近似正态分布
(2)几何均数(geometric mean) ①意义:n个数值的乘积开n次方即为这n个数的几何均数。它可 用来反映其平均增(减)倍数。 ②表示: ③计算:直接法: G=x。=lg'gx/n 加权法: G-e ④应用:呈倍数关系资料或原始观察值呈偏态分布,经对数转换后 呈正态分布或近似正态分布的资料。例如抗体滴度、细菌计数等。 ⑤注意 观察值中不能有零,不能同时有正值和负值。同一组数摇 的几何均数小于算术均数。 (3)中位数(median) ①意义:将一组观察值从小到大排序后,居于中间位置的那个值。 反映一批观察值在位次上的平均水平。 ③计算:直接法:先将观察值按从小到大顺序排列,再按以下公式 计算: n为奇数 x+2 n为偶数 频数表法: M=所在组段下限值+组距×”x50% M-L+ix (nx50%-2 ④适用条件:适合任何分布的资料。尤其适合于①偏态分布的资料 ②资料有不确定数值(开口资料) (4)百分位数: ①意义:将n个观察值从小到大依次排列,再分成100等份,对应 于%位的数值即为第x百分位数。中位数是百分位的特殊形式。 ②表示:Px ③计算 频数表法 P=L+ixn×x%-2) f ④应用:确定医学参考值范围(reference range): (5)众数(moke)总体中或样本中出现次数最多的数值 6)调和均数(ha monic n) ①意义:原始数据倒数的算术均数的倒数 ②表示:H ③计算: (三)描述离散趋势的指标 描述一组数据参差不齐的程度,反映数据的离散度 即个体观察值的变异 指衣 有:全距、四分 位数间距、离均差平方和、方差、标准差、变异系数 1,全距R: 优点:简便R=x -Y
缺点:①只利用了两个极端值,仅考虑两端数据的差异,不能全面 反映一组资料的离散程度。②易受个别极端值的影响,稳定性差。 ③大,R也会大。若两组例数相差悬殊,不宜用极差来比较两组的 变异程度。 (2)四分位数间距(quartile range)Q: 0=0一0=P.一P. 包含了全部观察值的一半,所以可看作中间一半观察值的极差 稳定性比极差好,但仍未考虑到每个观察值的变异度。 舌田描术信太 分布资料以及分布的 一端无确切数值资料的离 散程度。可用于各种类型的连续型变量。 (3)方差(variance)也称均方差(mean square deviation) ①意义:样本观察值的离均差平方和的均值。表示一组数据的平均 离散情况。 ②表示:方差(、$) ③计算 离均差Xμ 离均差和∑X-)=0 离均差平方和(sum of square)SS=/n=(X-)2 总体方差。2= 2X-四 样本方差5-2-∑X-x 因为 子中 数不 离均差平方和一定回减少,如 果仍用n做分母,算得的S总比c小(有偏估计):数学上已证明 分母改为n1后算得的$总在σ周围(无偏估计) (4)标准差(standard deviation)即方差的正平方根:其单位与 原最K的单位相同 ①意义:全面反映了 一组观察值的变异程度。(标准差越大,说明个 体之间的变异越大,数据越分散:反之,标准差越小, 说明个体 间的变异越小,数据越集中)。由标准差的大小可反映出均数对它所 代表的一组数据的代表性的好坏。 (②表示:标准差(σ、S) ③计算 直接法3=,②x-(区xm Σf-1 ④应用适合用来表达对称分布的离散趋势 (5)变异系数 coeffic ation) ①意义:反映资料的相对变异程度,便于资料间的相互比较。无单 ②符号:CV ③计算:C=(S/)×100%
④应用:①观察指标单位不同,如身高、体重②同单位资料,但均 数相差悬殊 变异指标小结: 极差较粗, 适合于任何分布 2.标准差与均数的单位相同,最常用,适合于近似正态分布 3.变异系数主要用于单位不同或均数相差悬殊资料 4.平均指标和变异指标分别反映资料的不同特征,常配套使用:如 正态分布:均数、标准差: 信态分布:中位数、四分位数何拒 (四)描述分布类型的特征 偏度系数 SKEW) 理论上总体偏度系数为0时,分布是对称的正值时,分布为 负信偏峰:负值时为正偏隆 峰度系数(coefficient of kurtosis,KURT) 理论上正态分布的总体峰度系数为0:取负值时,其分布较正 态分布的峰平阔取正值时其分布较正态分布的峰尖峭 正态分 的图形特点: 1. 正态曲线在横轴上方,且均数所在处最高: 2.正态分布以均数为中心,左右对称: 3.正态分布有两个参数,即均数和标准差(4,σ) 正态分布曲线下的面积有一定的规律性。 五 参考值范围(reference ranges)制定 (见正态分布的 用) (1)定义:是指特定的“正常”人群(排除了对所研究指标有影响 的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代 谢产物含量等数据中大多数个体的取值所在的范围。习惯上用该人 群95%的个体某项医学指标的取值范围作为该指标的参考值范围 (2)医学参考值的作用及意义: ①用以区分“正常”和“异常”个体, 为临床诊断提供参考: ②可用以反映不同时间、地区人群某项指标的生理变迁。 (3)方法: 参考值范围的制定 正态分布法 百分位数法 双侧 单侧 双侧 单侧 只有下限只有上限 只有下限只有上限 x±1.64S x-1.28Sx+1.28SP,-P6 +196 -164 x+l.64SP.5~P.5 x±2.58S -2.33S +2.33S 注:根据专业知识决定单侧还是双侧。若一个指标过大或过小 均属异常则相应的参考值范围既有上限又有下限,是双侧参考值范 围:若一个指标仅过大属异常则此指标的参考值范围只有上限,若 一个指标仅过小属异常则相应的参考值范围只有下限,是单侧参考 值范围。 般生理物质指标多为双侧、 毒物指标则多为单侧 计算器的使用 一、目的 1.掌握函数型计算器的基本使用方法