2020/2/14 0●● 单边检验和双边检验的即值? 莫德尔和他的学术之梦 围单达检轻的一国 经品 ●●●p-值的作用--来自ASA 一个例子: P值可以指示数据与 一个给定模型的不相容程度 。德天为真的率,也不旋量数嘉仅由随 ○祛家酷个德请森能成政策制定,不位只取决印值是香 0丽究膏需融贸究进行完整的根香、保还道明皮,才能作 ···非参数检验过程 。1.不涉及总体的分布 02.数据的形态各异 。定序戴 mplgGoodBotarBe ·名义歌 mpe:Male-Fomale 3.例子:Wilcoxon Rank Sum Test/Run Test E.M F.M.E.M.E.M.E.M.E.M.E.M.F
2020/2/14 6 单边检验和双边检验的p值?? 莫德尔和他的学术之梦 “实验的假设很有趣,而且数据也能够有力支持实验假设。”用来衡量 统计显著性的常用指标是P值。该实验中的P值为0.01,莫德尔十分有把 握能把自己的论文发表在高影响因子的刊物上。 由于担心实验结果陷入再现性争论,莫德尔和他的导师布莱恩•诺塞克(Brian Nosek)决定重复实验。添加了新的数据之后,P值变成了0.59,这个数字远未 达到学界一般能接受的显著性水平0.05。莫德尔观察到的心理学效应没有了, 他年少成名的梦也被打碎了。 http://www.guokr.com/article/438043/ p-值的作用----来自ASA P-值可以指示数据与一个给定模型的不相容程度 P-值不能衡量假设为真的概率,也不能衡量数据仅由随 机因素造成的概率 科学结论、商业决策或政策制定,不应只取决于p-值是否 达到一个给定的标准 研究者需对研究进行完整的报告、保证透明度,才能作 出合理的结论 P-值或显著性并不能衡量效应的大小和结果的重要性 P-值本身不能衡量模型或假设的可信度。 一个例子: 对两组学生进行语法测试,如何比较两 组学生的成绩是否存在差异? RANK of SCORE 0.0 5.0 10.0 15.0 20.0 25.0 Histogram For GROUP= Group1 Frequency 6 5 4 3 2 1 0 Std. Dev = 6.28 Mean = 13.0 N = 12.00 原始数据 秩 25 30 29 34 24 25 13 32 24 30 32 37 9.5 14.0 12.0 21.0 7.5 9.5 2.0 17.5 7.5 14.0 17.5 24.0 44 33 22 8 47 31 40 30 33 35 18 21 35 28 22 26.0 19.5 5.5 1.0 27.0 16.0 25.0 14.0 19.5 22.5 3.0 4.0 22.5 11.0 5.5 RANK of SCORE 0.0 5.0 10.0 15.0 20.0 25.0 Histogram For GROUP= Group2 Frequency 6 5 4 3 2 1 0 Std. Dev = 9.17 Mean = 14.8 N = 15.00 非参数检验过程 1.不涉及总体的分布 ⚫ Example: Probability Distributions, Independence 2. 数据的形态各异 ⚫ 定量数据 ⚫ 定序数据 • Example: Good-Better-Best ⚫ 名义数据 • Example: Male-Female 3.例子: Wilcoxon Rank Sum Test/Run Test F, F, F, F, F, F, F, F, M, M, M, M, M, M, M F, M, F, M, F, M, F, M, F, M, F, M, F, M, F 31 32 33 34 35 36
2020/2I14 ·●·非参数统计的基本内容 。估计 ●●● 函估计 3.参数与非参数统计比较 分 总付 8体 非参数检验的优点 ●● 非参数检验的弱点 ©滋是鞋餐察数,布广泛的遥用性,给条 。1.可能会浪费一些信息 特男 当 可以使用 。1.假定较少 。2.不需要对总体参数的假定 Ratio to Ordinal Scale 。3.与参数结果接近 02.大样本手算相当麻须 针对几乎所有类型的数据形态 03.一些表不易得到 。强调计算 ·在计算机盛行之前就已经发限起来: 估计涉及大量数据的计算 。。。Nonparametric vs Parametric ds 课程大纲 o Nonparametric models More flexibleo parametric model is needed Parametric models: But the model needs to be picked in advance. 1
2020/2/14 7 3. 参数与非参数统计比较 非参数统计的基本内容 估计 ⚫ 分布函数估计 ⚫ 函数估计 ⚫ 密度估计 ⚫ 统计关系估计: • 定性数据的关联分析 • 非参数回归 假设检验 ⚫ 单一总体 ⚫ 两总体 ⚫ 多总体 对总体假定较少,有广泛的适用性,结果 稳定性较好。 ⚫ 1. 假定较少 ⚫ 2. 不需要对总体参数的假定 ⚫ 3. 与参数结果接近 针对几乎所有类型的数据形态。 强调计算 ⚫ 在计算机盛行之前就已经发展起来; ⚫ 估计涉及大量数据的计算。 非参数检验的优点 1. 可能会浪费一些信息 n 特别当数据可以使用参数模型的时候。 n Example: Converting Data From Ratio to Ordinal Scale 2. 大样本手算相当麻烦 3. 一些表不易得到 非参数检验的弱点 Nonparametric vs Parametric methods Nonparametric models ⚫ More flexible-no parametric model is needed ⚫ But require storing the entire dataset ⚫ And the computation is performed with all data examples Parametric models: ⚫ Once fitted, only parameters need to be stored. ⚫ They are much more efficient in terms of computation ⚫ But the model needs to be picked in advance. 课程大纲 第一讲 绪论和基本要求 第二讲 非参数统计基本概念,分布函数估计 第三讲 秩统计量及分布,连续性修正 第四讲 单一样本的推断问题(1) 中位数检验 第五讲 单一样本的推断问题(2) 趋势和随机游程检验 第六讲 单一样本的推断问题(3) :置信区间计算 第七讲 分布的一致性检验 第八讲 理论部分:U统计量和渐进相对效率 第九讲 两样本位置检验 第十讲 多总体推断(一) 第十一讲 多总体推断(二) 第十二讲 多总体推断(三) 第十三讲 分类数据关系分析 第十四讲 秩相关分析 第十五讲 非参数密度估计 第十六讲 局部多项式回归** 37 38 39 40 41 42