返回首页

t检验 入门教程ppt

时间:2019-10-29 来源:原创/投稿/转载作者:管理员点击: 162

  t检验 入门教程ppt_数学_自然科学_专业资料。t检验 入门教程ppt

  t检验 主要内容 ? ? ? ? ? 假设检验的基本原理和步骤 单样本t检验 配对设计资料的t检验 两独立样本的t检验 两类错误 假设检验 ? 假设检验也叫显著性检验,是以小概率反证 法的逻辑推理,判断假设是否成立的统计方 法,它首先假设样本对应的总体参数(或分 布)与某个已知总体参数(或分布)相同, 然后根据统计量的分布规律来分析样本数 据,利用样本信息判断是否支持这种假设, 并对检验假设做出取舍抉择,做出的结论是 概率性的,不是绝对的肯定或否定。 假设检验的步骤 ? 建立检验假设和确定检验水准 ? 选定检验方法和计算检验统计量 ? 确定P值和做出推断结论 建立检验假设和确定检验水准 ? 在均数的比较中,检验假设是针对总体特征而 言,包括相互对立的两个方面,即两种假设: – 一 种 是 无 效 假 设 或 称 原 假 设 、 零 假 设, 符号 为 H0,它是要否定的假设; – 另一种是备择假设,记为H1,它是H0的对立面。 ? 二者是从反证法的思想提出的,H1和H0是相互 联系、又相互对立的假设。 建立检验假设和确定检验水准 ? 研究者可能有两种目的: – ①推断两个总体均数有无差别。不管是病人高于正 常人,还是低于正常人,两种可能性都存在,研究 者同等关心,应当用双侧检验。 – ②根据专业知识,已知病人不会低于正常人,或是 研究者只关心病人是否高于正常人,不关心病人是 否低于正常人,应当用单侧检验。 双侧检验和单侧检验 ? 在进行t检验时,如果其目的在于检验两个总体均数 是否相等,即为双侧检验。例如检验某种新降压药 与常用降压药效力是否相同?就是说,新药效力可 能比旧药好,也可能比旧药差,或者力相同,都有 可能。 ? 如果我们已知新药效力不可能低于旧药效力,例如 磺胺药 + 磺胺增效剂从理论上推知其效果不可能低 于单用磺胺药,这时,无效假设为 H0, 备择假设为 H1: μ1μ2 , 统计上称为单侧检验。 样本均数(其总体均数为μ) 与已知的总体均数μ0作比较 目的 H0 ? 双侧检验 是否μ≠μ0 μ=μ0 ? 单侧检验 是否μμ0 μ=μ0 或是否μμ0 μ=μ0 H1 μ≠μ0 μμ0 μμ0 两样本均数比较 (其总体均数分别为μ1与μ2) ? 目的 H0 ? 双侧检验 是否μ1≠μ2 μ1=μ2 ? 单侧检验 是否μ1μ2 μ1=μ2 或是否μ1μ2 μ1=μ2 H1 μ1≠μ2 μ1μ2 μ1μ2 检验水准 ? 假设检验还需根据不同研究目的事先设置是 否拒绝原假设的判断标准,即检验水准。检验 水准也称显著性水准,它指无效假设H0为真, 但被错误地拒绝的一个小概率值。 一般取α =0.05。 ? H0、H1和α的确定,以及单侧检验或双侧检验 的选择,都应结合研究设计,在未获得样本结 果之前决定,而不受样本结果的影响。 选定检验方法和计算检验统计量 ? 要根据研究设计的类型和统计推断的目的选用 不同的检验方法。如成组设计的两样本均数的 比较用t检验,多个样本均数的比较用F检验。 ? 检验统计量是用于抉择是否拒绝H0的统计量, 其统计分布在统计推断中是至关重要的,不同 的检验方法要用不同的方式计算现有样本的检 验统计量值。 确定P值和做出推断结论 ? P值是指由H0成立时的检验统计量出现在由样本计算 出来的检验统计量的末端或更末端处的概率值。 ? 当 P≤ α 时,结论为按所取检验水准拒绝 H0,接受 H1,这样做出结论的理由是:在 H0 成立的条件下, 出现等于及大于现有检验统计量值的概率P≤α ,是 小概率事件,这在一次抽样中是不大可能发生的, 即现有样本信息不支持H0因而拒绝它; ? 如Pα,即样本信息支持H0,就没有理由拒绝它,此 时只好接受它。 确定P值和做出推断结论 ? 假设检验的结论是具有概率性的。不管是否拒绝H0, 都有可能发生错误。 ? 拒绝 H0,不能认为 H0 肯定不成立,因为在 H0 成立的 条件下,出现现有检验统计量值及更极端情况的概率 虽小,但仍可能出现,只是可能性很小而已;同理, 不拒绝H0,也不能认为H0肯定成立。 ? 因为检验假设时,必须对被检验的假设做出明确判 断,只能从“拒绝”或“不拒绝”中选择一个较为合理的 决定。 t 检验 ? t检验亦称student t检验。 ? t检验的用途: – 样本均数与总体均数的比较; – 两样本均数的比较。 ? t检验的应用条件: – 当样本例数较小时,要求样本取自正态总体; – 做两样本均数比较时,还要求两样本的总体方差相 等。 样本均数与总体均数的比较 ? 样本均数与总体均数的比较的 t 检验,即单样 本 t 检验。比较的目的是推断样本所代表的未 知总体均数μ与已知的总体均数μ0有无差别。 ? 首先对所估计的总体提出一个假设,如: 假设 这个总体的平均数μ等于某个值μ0 ,然后通过 样本去推断这个假设是否可以接受,如果可以 接受,样本很可能来自这个总体;否则很可能 不是来自这个总体。 样本均数与总体均数的比较 ? 大量检测已知正常人血浆载脂蛋白E(apo E) 总体平均水平为4.15mmol/L。某医师经抽样测 得41例陈旧性心机梗死患者的血浆载脂蛋白E 平均浓度为5.22mmol/L,标准差为 1.61mmol/L。据此能否认为陈旧性心肌梗死患 者的血浆载脂蛋白E平均浓度与正常人的平均 浓度不一致? ? 建立检验假设和确定检验水准 H0:μ=μ0 H1:μ≠μ0 α=0.05 ? 选定检验方法和计算统计量 用单样本的t检验, x ? μ 0 x ? μ 0 5.22 - 4.15 t= = = = 4.26 sx s / n 1.61 / 41 自由度ν=41-1=40 ? 确定P值和作出推断结论 查t界值表,t0.05/2,40=2.021,tt0.05/2,40, P0.05。按α=0.05水准,拒绝H0,接受H1,可 认为陈旧性心肌梗死患者的血浆载脂蛋白E平 均浓度与正常人的差别有统计学意义,结合专 业可以认为前者平均浓度较高。 ttα/2,ν ttα/2,ν P α P α P α P t t0.05/2 t 配对设计定量资料的t 检验 ? 配对设计是将受试对象按一定条件配成对子, 再随机分配每对中的两个受试对象到不同处理 组。 ? 配对因素是影响实验效应的主要非处理因素。 – 例如,在动物实验中,常将窝别、性别相同,体重 相近的两个动物配成对子; – 人群试验中,常将性别相同、年龄相近的两个人配 成对子,这样可提高各处理组间的均衡性。 配对设计定量资料的t 检验 ? 配对设计资料分三种情况: – 配成对子的同对受试对象分别给予两种不同的处 理,其目的是推断两种处理的效果有无差别; – 同一受试对象分别接受两种不同处理,其目的是推 断两种处理的效果有无差别; – 同一受试对象处理前后的比较,其目的是推断某种 处理有无作用。 配对设计定量资料的t 检验 ? 配对设计的t检验研究的是差值均数(样 本均数)与理论上的差值总体均数的比 较。 ? 首先计算出各对差值d的均数。当两种处 理结果无差别或某种处理不起作用时, 理论上差值d的总体均数μd=0。 配对设计定量资料的t 检验 ? 可将配对设计资料的假设检验视为样本均 数与总体均数μd=0的比较。据定理: ? d ? μd d ?0 d t= = = sd sd / n sd / n ~t( n-1) 将大白鼠配成8对,每对分别饲以正常饲料和缺乏维 生素E饲料,测得两组大白鼠肝中维生素A的含量, 试比较两组大白鼠中维生素A的含量有无差别。 大白鼠 配对号 1 2 3 4 5 6 7 8 Mean 正常 饲料组 3550 2000 3000 3950 3800 3750 3450 3050 3318.75 维生素E 缺乏组 2450 2400 1800 3200 3250 2700 2500 1750 2506.25 差数 d 1100 -400 1200 750 550 1050 950 1300 812.5 ? 建立检验假设和确定检验水准 H0:μd=0 H1: μd≠ 0 α=0.05 ? 选定检验方法和计算统计量 d 6500 ∑ = = 812.5 (U/g) d = n 8 S Sd = d = n 7370000 ? (6500 ) 2 / 8 = 193 .1298 (U / g ) 8 × (8 ? 1) t= d ? μd 812.5 - 0 = = 4.2070, ν = 8 ? 1 = 7 S d / n 193.1298 ? 确定P值和作出推断结论 – 查t界值表(双侧),tt 0.05/2, 7 =2.365, P0.05 – 按 α=0.05水准,拒绝H0,接受H1,可以认为 两种饲料喂养的两组大白鼠中维生素A的含 量有差别。正常饲料组比缺乏维生素E饲料 组的含量要高。 例3:胃癌或巨型胃溃疡13人, 在实行全胃 切除术前后的体重(kg):试比较手术前 后体重有无变化? 配对号 1 2 3 4 5 6 7 8 9 10 11 12 13 术前 42.5 48.0 39.0 46.0 58.5 47.5 39.0 58.0 51.0 43.0 38.0 50.0 57.5 术后 52.0 51.5 45.0 52.5 49.0 55.0 52.0 52.0 50.5 50.0 41.0 51.5 72.2 差数 d 9.5 3.5 6.0 6.5 -9.5 7.5 13.0 -6.0 -0.5 7.0 3.0 1.5 14.7 H0:μd=0 H1: μd≠ 0 n Sd Sd = = 1.904 ( kg ) n 4.323 t = = 2.27 , ν = 12 1.904 d = α=0.05 ∑d 56 . 2 = = 4 . 323 (kg) 13 ? t t 0.05/2, 12 =2.179, P0.05,拒绝 H0,接受H1,可以认为术前后体重 差别有统计学意义。 例:尿铅测定长期以来用湿式热消化 法-双硫腙法,后改用硝酸-高锰酸钾 冷消化法,试就下表资料(μmol/L), 说明两法测得结果有无差别? 患者号 1 2 3 4 5 6 7 8 9 10 Mean 冷消化法 2.41 12.07 2.90 1.64 2.75 1.06 2.23 0.77 3.67 0.37 2.99 热消化法 2.80 11.24 3.04 1.83 1.88 1.45 2.43 0.92 3.81 0.37 2.98 差数 d -0.39 0.83 -0.14 -0.19 0.87 -0.39 -0.20 -0.15 -0.14 0.00 0.01 H0:μd=0 H1: μd≠ 0 α=0.05 n 10 Sd 0.46 Sd = = = 0.145( μmol / L) n 10 d 0.010 t= = = 0.069 , ν =9 s d 0.145 d 0.10 ∑ d= = = 0.010( μmol / L) ? 查t界值表,t t 0.05/2, 9,P0.05,不拒 绝H0,故不能认为两法测得的尿铅结果 有差别。 两组完全随机化设计 ? 将受试对象完全随机地分配到两组中, 这两组分别接受不同的处理。这样的设 计称为两组完全随机化设计,也叫成组 设计。 ? 目的是推断两总体均数μ1与μ2有无差 别。 两组完全随机化设计资料 样本均数的比较 ? 正态化、总体方差相等 – 两独立样本t检验(两组完全随机化设计资 料样本均数的t检验) ? 非正态化、总体方差不等 – 近似t检验或Wilcoxon秩和检验 总体方差相等的 两独立样本t检验 ? 从两个正态总体N(μ1,σ2)和N(μ2,σ2)中随 机抽样,样本含量分别为n1,n2,样本均数和标 准差分别为 x 1 和S1, x 2和S2,根据定理, ( X 1 ? X 2 ) ? ( μ1 ? μ 2 ) ~t( n +n -2) t= 1 2 S x1 ? x2 总体方差相等的 两独立样本t检验 ? 当两总体方差相等时,可将两样本方差 合并为 S c2 。 ( X 1 ? X 2 ) ? ( μ1 ? μ 2 ) X1 ? X 2 t= = S x1 ? x2 S x1 ? x2 S x1 ? x 2 1 1 = Sc 2 ( + ) n1 n2 ν = n1 + n2 ? 2 ? 合并方差 Sc2 = (n1 ? 1)S + (n2 ? 1)S = (n1 ? 1) + (n2 ? 1) 2 1 2 2 2 2 2 2 x ? ( x ) / n + x ? ( X ) ∑ 1 ∑ 1 1 ∑ 2 ∑ 2 /n2 n1 + n2 ? 2 ? 合并标准误 S x1 ? x 2 1 1 = Sc 2 ( + ) n1 n2 ? 例:某医院研究乳酸脱氢同工酶(LDH) 测定对心肌梗死的诊断价值时,曾用随机 抽样方法比较了10例心肌梗死患者与10例 健康人LDH测定值的差别,结果如下,试 问LDH测定值在两组间有无差别? ? 患者: 23.2 45.0 45.0 40.0 35.0 44.1 42.0 52.5 50.0 58.0 ? 健康人:20.0 31.0 30.5 23.1 24.2 38.0 35.5 37.8 39.0 31.0 ? H0:μ1=μ2 α=0.05 n1 = 10 , n2 = 10 , H1:μ1≠μ2 X1 = 43 .48, S1 = 9 .64 S 2 = 6.74 X 2 = 31 .01, 2 2 2 2 ( n ? 1 ) S + ( n ? 1 ) S ( 10 ? 1 ) × 9 . 64 + ( 10 ? 1 ) × 6 . 74 1 2 2 Sc2 = 1 = = 69.1786 (n1 ?1) + (n2 ?1) 10 ?1 +10 ?1 S x1 ? x2 1 1 1 1 = S c 2 ( + ) = 69.1786 × ( + ) = 3.72 n1 n2 10 10 43.48? 31.01 t= = 3.352, ν = 10 +10- 2 = 18 3.72 ? 确定P界作出结论 – tt 0.005/2,18 =3.197, P0.005 – 按α=0.05 水准,拒绝H0,接受H1。可以认 为乳酸脱氢同工酶测定值在心肌梗死与健康 人之间有差别,心肌梗死患者的含量比健康 人的要高。 ? 例:为研究外用中药擦剂骨肌康对小鼠琼脂 肉芽肿的抑制作用,某医院医师对一级昆明 种小鼠20只(雌雄各半)按完全随机分配方 案进行了实验观察。其中对照组10只,给予 0.5ml 65%乙醇;另10只施用大剂量骨肌 康,给予0.2g生药/0.5ml 65%乙醇。 ? 观察肉芽肿结果如下,据此结果能否认为骨 肌康擦剂与对照组比较具有抑制小鼠琼脂肉 芽肿生长的作用? 骨肌康组 108.0 74.8 31.2 132.0 147.6 98.5 82.2 93.3 85.5 110.4 对照组 94.8 122.5 144.1 151.2 189.3 204.2 155.6 160.3 178.3 165.4 H0:μ1=μ2 α=0.05 n1 = 10, n 2 = 10, 2 c H1:μ1≠μ2 S1 = 32 .10 X 1 = 96 .35, X 2 = 156 .57, S 2 = 31 .74 2 (n1 ? 1) S12 + (n2 ? 1) S 2 (10 ? 1) × 32.10 2 + (10 ? 1) × 31.74 2 S = = = 1018.9188 (n1 ? 1) + (n2 ? 1) 10 ? 1 + 10 ? 1 S x1 ? x2 = S c 2 ( 1 1 1 1 + ) = 1018.9188 × ( + ) = 14.2753 10 10 n1 n2 96.35 ? 156.57 t= = ?4.22 14.2753 ? ν=10-1+10-1=18 ? tt 0.005/2,18 =3.197, P0.005 ? 拒绝H0,接受H1。可以认为骨肌康擦剂 与对照组比较具有抑制小鼠琼脂肉芽肿 生长的作用。 两样本的方差齐性检验 ? 两个小样本比较的t检验,要求相应的两 总体方差相等,即方差齐。 ? 即使两总体方差相等,样本方差也会有 抽样波动,样本方差不等是否由于抽样 误差所致? 两样本的方差齐性检验 ? 可用F检验,F值可用下式计算: S12 (较大方差) F= 2 S(较小方差) 2 ν 1 = n1 ? 1, ν 2 = n2 ? 1 ? 式中为较大的样本方差,为较小的 样本方差,分子的自由度是ν1,分 母的自由度是ν2 。 两样本的方差齐性检验 ? F值是两方差之比,如仅是抽样误差 的影响,它一般不会离1太远,F分 布就是反映此概率的分布。 ? 求得F值后,查方差齐性检验用的F 界值表得到P值(F值越大,P值越 小)。 两样本的方差齐性检验 ? 例:某医生测试了25例正常人和32例喉 癌患者的血清铁蛋白(SF)平均浓度 (ug/L),试判断正常人与喉癌患者的 血清铁蛋白含量的总体方差是否相同? 组别 正常人 喉癌患者 样本量 x ± SD 25 64.0±24.40 32 244.2±57.61 2 2 σ = σ H0: 1 2 α=0.05 H1: 2 σ 12 ≠ σ 2 57.61 F= = 5.57 2 24.40 F0.05 ( 30.24 ) = 2.21 P0.05,拒绝H0,接受H1,可认为正常人 的血清铁蛋白总体方差与喉癌病人不同。 2 总体方差不等的近似t检验 ? 如果两总体方差的差别有统计意义,即方差不 等,两小样本均数的比较,可选择以下方法: – 进行变量变换,如果变换后数据满足 t 检验条件, 再进行t检验; – 采用非参数检验法(Wilcoxon秩和检验); – 近似t检验法(又称校正t检验或检验),常用 Cochran-Cox 近 似 t 检 验 、 Satterthwaite 法 、 AspinWelch法等。 Cochran-Cox近似t检验 ? 此方法是对临界值进行校正 X1 ? X 2 X1 ? X 2 t = = 2 2 S x1 ? x2 S2 S1 + n1 n2 ν 1 = n1 ? 1 ν 2 = n2 ? 1 tα = 2 S2 ? t + S x1 α ,ν 1 x 2 ? tα ,ν 2 2 S2 + S x1 x2 2 S12 S2 ? tα ,ν 1 + ? tα ,ν 2 n2 n1 = 2 S12 S 2 + n1 n2 Cochran-Cox近似t检验 ? 例:某医生测试了25例正常人和32例喉 癌患者的血清铁蛋白(SF)平均浓度 (ug/L),试判断正常人与喉癌患者的 血清铁蛋白含量的平均水平是否相同? 组别 正常人 喉癌患者 样本量 x ± SD 25 64.0±24.40 32 244.2±57.61 H0:μ1=μ2 α=0.05 t = H1:μ1≠μ2 64 ? 244.2 24.4 57.61 + 25 32 2 2 X1 ? X 2 S S + n1 n2 2 1 2 2 = = ?15.957 t0.05 / 2,ν 1 = 2.064 t0.05 / 2,ν 2 = 2.040 24.4 2 57.612 × 2.064 + × 2.040 32 tα = 25 = 2.044 2 2 24.4 57.61 + 25 32 t tα P0.05, 拒绝H0,接受H1。可以认为正常人与喉癌患者 的血清铁蛋白含量的差异有统计学意义,喉癌患者的含 量高于正常人。 假设检验的两类错误 结论 不拒绝 H0 拒绝 H0 线 正确 正确 Ⅰ型错误 II型错误 正确 假设检验的两类错误 ? Ⅰ型错误,第一类错误、假阳性错误 , 就是在 假设检验作推断结论时,拒绝了实际上是正确 的原假设H0,其概率用α表示。 ? Ⅰ型错误是针对原假设而言的,α就是事先规 定的允许犯Ⅰ型错误的概率值,如规定 α =0.05 ,意味着在某特定总体抽样,100次拒 绝 H0 的假设检验中,最多有5 次允许发生第一 类错误。与此相应,推断正确的可能性为 1α,1-α又称为可信度。 假设检验的两类错误 ? Ⅱ型错误,第二类错误、假阴性错误, 即不 拒绝实际上是不成立的 H0。就是无效假设原 本是不正确的,但所算得的统计量不足以拒 绝它,错误地得出了无差别的结论。 ? Ⅱ型错误是针对备择假设而言的,其概率值 用β表示。β值的大小一般未知,只有在不 同总体特征已知的基础上,按预定的 α 和 n 才 能做出估算。 检验效能 ? 1-β即指在备择假设正确的前提下,拒 绝了实际上不成立的H0而做出正确推断 的概率,又称为检验效能。 ? 其意义为当两总体确有差别,按规定的 假设检验水准α所能发现该差别的能力。 假设检验的两类错误 ? 统计推断中,α的取值是事先选定的,一般取 α=0.05或0.01。 ? 在样本含量固定的情况下,把α定0.01,就是 允许产生1%第一类错误;把α定为0.05,就是 允许产生5%第一类错误,前者比后者第一类 错误的概率较小,但这时,第二类的错误就增 大了。 H0 μ-σ -3 -2 -1 μ 0 β α μ+σ 1 H1 2 3 t α,v 假设检验的两类错误 ? 在样本量固定的情况下,减小α会引起β 增大;减小β会引起α增大。 ? 一般来说,定α=0.05是比较适宜的。 ? 若要同时减小α和β,只有增大样本含 量。 假设检验的注意事项 ? ? ? ? 要有严密的研究设计 统计方法必须符合其适用条件 正确表述统计推断结论 注意对“阴性”结果的分析 ? 注意可信区间估计与假设检验的关系 ? 应注意统计学意义和专业意义的差别,有 统计学意义并非一定有实际意义。 ? 拒绝 H0, 习惯上称 “ 显著 ”, 不应误解为相差 很大,或在医学上有显著的实用价值;反 之,不拒绝H0,习惯上亦称“不显著”,不应 误解为相差不大,或肯定无差别。 ? 无论是拒绝H0,或不拒绝H0,都存在发生 统计推断错误的可能,因此,推断结论不 能绝对化。 ? 例:有人调查城市女婴出生体重(kg), 北方 5385人,均数为3.08,标准差为0.53; 南方 4806人,均数为3.10,标准差为0.34。 尽 管 出 生 体 重 均 数 仅 相 差 0 . 0 2 kg, 但 t=2.93, P=0.0034,这是因为样本量很大。 ? 所以决不能因为P0.01差别有极显著意义 而作出北方和南方城市女婴出生体重均数 相差很大的结论。 ? “ 阴性 ” 结果是指经假设检验, Pα,得出 差别无统计学意义的结论。此时只能表达 为“尚不能认为两个(或多个)总体特征存 在差别”,而不能下两总体相同或无差别的 结论。 ? 若比较组间确有差别,因样本含量不足, 也会出现 “ 阴性 ” 结果;当对比组间确无差 别时,更有可能出现“阴性”结果。 可信区间估计与假设检验的关系 ? 两者都是对总体特征进行推断的方法。区间估计用以 说明参数量的大小,如推断总体均数所在的范围,而 假设经验用于推论质的差别,如推断总体均数是否不 同。 ? 可信区间不仅可回答假设检验的问题,而且可以比假 设检验提供更多的信息,可信区间在解决假设检验问 题基础上,还可获得是否有专业意义的信息。 ? 但可信区间不能完全替代假设检验,可信区间只能预 先规定的检验水准下进行计算,而假设检验能够获得 一个确切的P值。 (1) (2) (4) 有专业实际 意义的值 (3) (5) H0 ? 有统计学意义 (1)有专业意义 (2)可能有专业意义 (3)无专业 意义 ? 无统计学意义 (4)样本例数过少或误差过大 (5)不拒绝H0 小结 ? ? ? ? ? 假设检验的基本原理和步骤 单样本t检验 配对设计资料的t检验 两独立样本的t检验 两类错误

【责任编辑:管理员】
随机推荐 更多>>