t检验入门教程ppt

时间:2019-10-29 来源：原创/投稿/转载作者：管理员点击: 162

　　t检验入门教程ppt_数学_自然科学_专业资料。t检验入门教程ppt

　　t检验主要内容 ? ? ? ? ? 假设检验的基本原理和步骤单样本t检验配对设计资料的t检验两独立样本的t检验两类错误假设检验 ? 假设检验也叫显著性检验，是以小概率反证法的逻辑推理，判断假设是否成立的统计方法，它首先假设样本对应的总体参数（或分布）与某个已知总体参数（或分布）相同，然后根据统计量的分布规律来分析样本数据，利用样本信息判断是否支持这种假设，并对检验假设做出取舍抉择，做出的结论是概率性的，不是绝对的肯定或否定。假设检验的步骤 ? 建立检验假设和确定检验水准 ? 选定检验方法和计算检验统计量 ? 确定P值和做出推断结论建立检验假设和确定检验水准 ? 在均数的比较中，检验假设是针对总体特征而言，包括相互对立的两个方面，即两种假设： – 一种是无效假设或称原假设、零假设，符号为 H0，它是要否定的假设； – 另一种是备择假设，记为H1，它是H0的对立面。 ? 二者是从反证法的思想提出的，H1和H0是相互联系、又相互对立的假设。建立检验假设和确定检验水准 ? 研究者可能有两种目的： – ①推断两个总体均数有无差别。不管是病人高于正常人，还是低于正常人，两种可能性都存在，研究者同等关心，应当用双侧检验。 – ②根据专业知识，已知病人不会低于正常人，或是研究者只关心病人是否高于正常人，不关心病人是否低于正常人，应当用单侧检验。双侧检验和单侧检验 ? 在进行t检验时，如果其目的在于检验两个总体均数是否相等，即为双侧检验。例如检验某种新降压药与常用降压药效力是否相同？就是说，新药效力可能比旧药好，也可能比旧药差，或者力相同，都有可能。 ? 如果我们已知新药效力不可能低于旧药效力，例如磺胺药 + 磺胺增效剂从理论上推知其效果不可能低于单用磺胺药，这时，无效假设为 H0, 备择假设为 H1： μ1μ2 , 统计上称为单侧检验。样本均数（其总体均数为μ）与已知的总体均数μ0作比较目的 H0 ? 双侧检验是否μ≠μ0 μ=μ0 ? 单侧检验是否μμ0 μ=μ0 或是否μμ0 μ=μ0 H1 μ≠μ0 μμ0 μμ0 两样本均数比较（其总体均数分别为μ1与μ2） ? 目的 H0 ? 双侧检验是否μ1≠μ2 μ1=μ2 ? 单侧检验是否μ1μ2 μ1=μ2 或是否μ1μ2 μ1=μ2 H1 μ1≠μ2 μ1μ2 μ1μ2 检验水准 ? 假设检验还需根据不同研究目的事先设置是否拒绝原假设的判断标准，即检验水准。检验水准也称显著性水准，它指无效假设H0为真，但被错误地拒绝的一个小概率值。一般取α =0.05。 ? H0、H1和α的确定，以及单侧检验或双侧检验的选择，都应结合研究设计，在未获得样本结果之前决定，而不受样本结果的影响。选定检验方法和计算检验统计量 ? 要根据研究设计的类型和统计推断的目的选用不同的检验方法。如成组设计的两样本均数的比较用t检验，多个样本均数的比较用F检验。 ? 检验统计量是用于抉择是否拒绝H0的统计量，其统计分布在统计推断中是至关重要的，不同的检验方法要用不同的方式计算现有样本的检验统计量值。确定P值和做出推断结论 ? P值是指由H0成立时的检验统计量出现在由样本计算出来的检验统计量的末端或更末端处的概率值。 ? 当 P≤ α 时，结论为按所取检验水准拒绝 H0，接受 H1，这样做出结论的理由是：在 H0 成立的条件下，出现等于及大于现有检验统计量值的概率P≤α ，是小概率事件，这在一次抽样中是不大可能发生的，即现有样本信息不支持H0因而拒绝它； ? 如Pα，即样本信息支持H0，就没有理由拒绝它，此时只好接受它。确定P值和做出推断结论 ? 假设检验的结论是具有概率性的。不管是否拒绝H0，都有可能发生错误。 ? 拒绝 H0，不能认为 H0 肯定不成立，因为在 H0 成立的条件下，出现现有检验统计量值及更极端情况的概率虽小，但仍可能出现，只是可能性很小而已；同理，不拒绝H0，也不能认为H0肯定成立。 ? 因为检验假设时，必须对被检验的假设做出明确判断，只能从“拒绝”或“不拒绝”中选择一个较为合理的决定。 t 检验 ? t检验亦称student t检验。 ? t检验的用途： – 样本均数与总体均数的比较； – 两样本均数的比较。 ? t检验的应用条件： – 当样本例数较小时，要求样本取自正态总体； – 做两样本均数比较时，还要求两样本的总体方差相等。样本均数与总体均数的比较 ? 样本均数与总体均数的比较的 t 检验，即单样本 t 检验。比较的目的是推断样本所代表的未知总体均数μ与已知的总体均数μ0有无差别。 ? 首先对所估计的总体提出一个假设，如: 假设这个总体的平均数μ等于某个值μ0 ，然后通过样本去推断这个假设是否可以接受，如果可以接受，样本很可能来自这个总体；否则很可能不是来自这个总体。样本均数与总体均数的比较 ? 大量检测已知正常人血浆载脂蛋白E（apo E）总体平均水平为4.15mmol/L。某医师经抽样测得41例陈旧性心机梗死患者的血浆载脂蛋白E 平均浓度为5.22mmol/L，标准差为 1.61mmol/L。据此能否认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的平均浓度不一致？ ? 建立检验假设和确定检验水准 H0：μ=μ0 H1：μ≠μ0 α=0.05 ? 选定检验方法和计算统计量用单样本的t检验， x ? μ 0 x ? μ 0 5.22 - 4.15 t= = = = 4.26 sx s / n 1.61 / 41 自由度ν=41-1=40 ? 确定P值和作出推断结论查t界值表，t0.05/2,40=2.021，tt0.05/2,40， P0.05。按α=0.05水准，拒绝H0，接受H1，可认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的差别有统计学意义，结合专业可以认为前者平均浓度较高。 ttα/2,ν ttα/2,ν P α P α P α P t t0.05/2 t 配对设计定量资料的t 检验 ? 配对设计是将受试对象按一定条件配成对子，再随机分配每对中的两个受试对象到不同处理组。 ? 配对因素是影响实验效应的主要非处理因素。 – 例如，在动物实验中，常将窝别、性别相同，体重相近的两个动物配成对子; – 人群试验中，常将性别相同、年龄相近的两个人配成对子，这样可提高各处理组间的均衡性。配对设计定量资料的t 检验 ? 配对设计资料分三种情况： – 配成对子的同对受试对象分别给予两种不同的处理，其目的是推断两种处理的效果有无差别； – 同一受试对象分别接受两种不同处理，其目的是推断两种处理的效果有无差别； – 同一受试对象处理前后的比较，其目的是推断某种处理有无作用。配对设计定量资料的t 检验 ? 配对设计的t检验研究的是差值均数（样本均数）与理论上的差值总体均数的比较。 ? 首先计算出各对差值d的均数。当两种处理结果无差别或某种处理不起作用时，理论上差值d的总体均数μd=0。配对设计定量资料的t 检验 ? 可将配对设计资料的假设检验视为样本均数与总体均数μd=0的比较。据定理： ? d ? μd d ?0 d t= = = sd sd / n sd / n ～t（ n-1）将大白鼠配成8对，每对分别饲以正常饲料和缺乏维生素E饲料，测得两组大白鼠肝中维生素A的含量，试比较两组大白鼠中维生素A的含量有无差别。大白鼠配对号 1 2 3 4 5 6 7 8 Mean 正常饲料组 3550 2000 3000 3950 3800 3750 3450 3050 3318.75 维生素E 缺乏组 2450 2400 1800 3200 3250 2700 2500 1750 2506.25 差数 d 1100 -400 1200 750 550 1050 950 1300 812.5 ? 建立检验假设和确定检验水准 H0：μd=0 H1: μd≠ 0 α=0.05 ? 选定检验方法和计算统计量 d 6500 ∑ = = 812.5 (U/g) d = n 8 S Sd = d = n 7370000 ? (6500 ) 2 / 8 = 193 .1298 (U / g ) 8 × (8 ? 1) t= d ? μd 812.5 - 0 = = 4.2070, ν = 8 ? 1 = 7 S d / n 193.1298 ? 确定P值和作出推断结论 – 查t界值表（双侧），tt 0.05/2, 7 =2.365, P0.05 – 按 α＝0.05水准，拒绝H0，接受H1,可以认为两种饲料喂养的两组大白鼠中维生素A的含量有差别。正常饲料组比缺乏维生素Ｅ饲料组的含量要高。例3：胃癌或巨型胃溃疡13人，在实行全胃切除术前后的体重（kg）：试比较手术前后体重有无变化？配对号 1 2 3 4 5 6 7 8 9 10 11 12 13 术前 42.5 48.0 39.0 46.0 58.5 47.5 39.0 58.0 51.0 43.0 38.0 50.0 57.5 术后 52.0 51.5 45.0 52.5 49.0 55.0 52.0 52.0 50.5 50.0 41.0 51.5 72.2 差数 d 9.5 3.5 6.0 6.5 -9.5 7.5 13.0 -6.0 -0.5 7.0 3.0 1.5 14.7 H0：μd=0 H1: μd≠ 0 n Sd Sd = = 1.904 ( kg ) n 4.323 t = = 2.27 , ν = 12 1.904 d = α=0.05 ∑d 56 . 2 = = 4 . 323 (kg) 13 ? t t 0.05/2, 12 =2.179, P0.05，拒绝 H0，接受H1，可以认为术前后体重差别有统计学意义。例：尿铅测定长期以来用湿式热消化法-双硫腙法，后改用硝酸-高锰酸钾冷消化法，试就下表资料(μmol/L)，说明两法测得结果有无差别？患者号 1 2 3 4 5 6 7 8 9 10 Mean 冷消化法 2.41 12.07 2.90 1.64 2.75 1.06 2.23 0.77 3.67 0.37 2.99 热消化法 2.80 11.24 3.04 1.83 1.88 1.45 2.43 0.92 3.81 0.37 2.98 差数 d -0.39 0.83 -0.14 -0.19 0.87 -0.39 -0.20 -0.15 -0.14 0.00 0.01 H0：μd=0 H1: μd≠ 0 α=0.05 n 10 Sd 0.46 Sd = = = 0.145( μmol / L) n 10 d 0.010 t= = = 0.069 ， ν =9 s d 0.145 d 0.10 ∑ d= = = 0.010( μmol / L) ? 查t界值表，t t 0.05/2, 9，P0.05，不拒绝H0，故不能认为两法测得的尿铅结果有差别。两组完全随机化设计 ? 将受试对象完全随机地分配到两组中，这两组分别接受不同的处理。这样的设计称为两组完全随机化设计，也叫成组设计。 ? 目的是推断两总体均数μ1与μ2有无差别。两组完全随机化设计资料样本均数的比较 ? 正态化、总体方差相等 – 两独立样本t检验（两组完全随机化设计资料样本均数的t检验） ? 非正态化、总体方差不等 – 近似t检验或Wilcoxon秩和检验总体方差相等的两独立样本t检验 ? 从两个正态总体N（μ1,σ2）和N（μ2,σ2）中随机抽样，样本含量分别为n1，n2，样本均数和标准差分别为 x 1 和S1， x 2和S2，根据定理， ( X 1 ? X 2 ) ? ( μ1 ? μ 2 ) ～t（ n +n -2） t= 1 2 S x1 ? x2 总体方差相等的两独立样本t检验 ? 当两总体方差相等时，可将两样本方差合并为 S c2 。 ( X 1 ? X 2 ) ? ( μ1 ? μ 2 ) X1 ? X 2 t= = S x1 ? x2 S x1 ? x2 S x1 ? x 2 1 1 = Sc 2 ( + ) n1 n2 ν = n1 + n2 ? 2 ? 合并方差 Sc2 = (n1 ? 1)S + (n2 ? 1)S = (n1 ? 1) + (n2 ? 1) 2 1 2 2 2 2 2 2 x ? ( x ) / n + x ? ( X ) ∑ 1 ∑ 1 1 ∑ 2 ∑ 2 /n2 n1 + n2 ? 2 ? 合并标准误 S x1 ? x 2 1 1 = Sc 2 ( + ) n1 n2 ? 例：某医院研究乳酸脱氢同工酶（LDH）测定对心肌梗死的诊断价值时，曾用随机抽样方法比较了10例心肌梗死患者与10例健康人LDH测定值的差别，结果如下，试问LDH测定值在两组间有无差别？ ? 患者： 23.2 45.0 45.0 40.0 35.0 44.1 42.0 52.5 50.0 58.0 ? 健康人：20.0 31.0 30.5 23.1 24.2 38.0 35.5 37.8 39.0 31.0 ? H0：μ1=μ2 α=0.05 n1 = 10 , n2 = 10 , H1：μ1≠μ2 X1 = 43 .48, S1 = 9 .64 S 2 = 6.74 X 2 = 31 .01, 2 2 2 2 ( n ? 1 ) S + ( n ? 1 ) S ( 10 ? 1 ) × 9 . 64 + ( 10 ? 1 ) × 6 . 74 1 2 2 Sc2 = 1 = = 69.1786 (n1 ?1) + (n2 ?1) 10 ?1 +10 ?1 S x1 ? x2 1 1 1 1 = S c 2 ( + ) = 69.1786 × ( + ) = 3.72 n1 n2 10 10 43.48? 31.01 t= = 3.352, ν = 10 +10- 2 = 18 3.72 ? 确定P界作出结论 – tt 0.005/2,18 =3.197, P0.005 – 按α=0.05 水准，拒绝H0，接受H1。可以认为乳酸脱氢同工酶测定值在心肌梗死与健康人之间有差别，心肌梗死患者的含量比健康人的要高。 ? 例：为研究外用中药擦剂骨肌康对小鼠琼脂肉芽肿的抑制作用，某医院医师对一级昆明种小鼠20只（雌雄各半）按完全随机分配方案进行了实验观察。其中对照组10只，给予 0.5ml 65%乙醇；另10只施用大剂量骨肌康，给予0.2g生药/0.5ml 65%乙醇。 ? 观察肉芽肿结果如下，据此结果能否认为骨肌康擦剂与对照组比较具有抑制小鼠琼脂肉芽肿生长的作用？骨肌康组 108.0 74.8 31.2 132.0 147.6 98.5 82.2 93.3 85.5 110.4 对照组 94.8 122.5 144.1 151.2 189.3 204.2 155.6 160.3 178.3 165.4 H0：μ1=μ2 α=0.05 n1 = 10, n 2 = 10, 2 c H1：μ1≠μ2 S1 = 32 .10 X 1 = 96 .35, X 2 = 156 .57, S 2 = 31 .74 2 (n1 ? 1) S12 + (n2 ? 1) S 2 (10 ? 1) × 32.10 2 + (10 ? 1) × 31.74 2 S = = = 1018.9188 (n1 ? 1) + (n2 ? 1) 10 ? 1 + 10 ? 1 S x1 ? x2 = S c 2 ( 1 1 1 1 + ) = 1018.9188 × ( + ) = 14.2753 10 10 n1 n2 96.35 ? 156.57 t= = ?4.22 14.2753 ? ν=10-1+10-1=18 ? tt 0.005/2,18 =3.197, P0.005 ? 拒绝H0，接受H1。可以认为骨肌康擦剂与对照组比较具有抑制小鼠琼脂肉芽肿生长的作用。两样本的方差齐性检验 ? 两个小样本比较的t检验，要求相应的两总体方差相等，即方差齐。 ? 即使两总体方差相等，样本方差也会有抽样波动，样本方差不等是否由于抽样误差所致？两样本的方差齐性检验 ? 可用F检验，F值可用下式计算： S12 (较大方差） F= 2 S（较小方差） 2 ν 1 = n1 ? 1, ν 2 = n2 ? 1 ? 式中为较大的样本方差，为较小的样本方差，分子的自由度是ν1，分母的自由度是ν2 。两样本的方差齐性检验 ? F值是两方差之比，如仅是抽样误差的影响，它一般不会离1太远，F分布就是反映此概率的分布。 ? 求得F值后，查方差齐性检验用的F 界值表得到P值（F值越大，P值越小）。两样本的方差齐性检验 ? 例：某医生测试了25例正常人和32例喉癌患者的血清铁蛋白（SF）平均浓度（ug/L），试判断正常人与喉癌患者的血清铁蛋白含量的总体方差是否相同？组别正常人喉癌患者样本量 x ± SD 25 64.0±24.40 32 244.2±57.61 2 2 σ = σ H0： 1 2 α=0.05 H1： 2 σ 12 ≠ σ 2 57.61 F= = 5.57 2 24.40 F0.05 ( 30.24 ) = 2.21 P0.05，拒绝H0，接受H1，可认为正常人的血清铁蛋白总体方差与喉癌病人不同。 2 总体方差不等的近似t检验 ? 如果两总体方差的差别有统计意义，即方差不等，两小样本均数的比较，可选择以下方法： – 进行变量变换，如果变换后数据满足 t 检验条件，再进行t检验； – 采用非参数检验法（Wilcoxon秩和检验）； – 近似t检验法（又称校正t检验或检验），常用 Cochran-Cox 近似 t 检验、 Satterthwaite 法、 AspinWelch法等。 Cochran-Cox近似t检验 ? 此方法是对临界值进行校正 X1 ? X 2 X1 ? X 2 t = = 2 2 S x1 ? x2 S2 S1 + n1 n2 ν 1 = n1 ? 1 ν 2 = n2 ? 1 tα = 2 S2 ? t + S x1 α ,ν 1 x 2 ? tα ,ν 2 2 S2 + S x1 x2 2 S12 S2 ? tα ,ν 1 + ? tα ,ν 2 n2 n1 = 2 S12 S 2 + n1 n2 Cochran-Cox近似t检验 ? 例：某医生测试了25例正常人和32例喉癌患者的血清铁蛋白（SF）平均浓度（ug/L），试判断正常人与喉癌患者的血清铁蛋白含量的平均水平是否相同？组别正常人喉癌患者样本量 x ± SD 25 64.0±24.40 32 244.2±57.61 H0：μ1=μ2 α=0.05 t = H1：μ1≠μ2 64 ? 244.2 24.4 57.61 + 25 32 2 2 X1 ? X 2 S S + n1 n2 2 1 2 2 = = ?15.957 t0.05 / 2,ν 1 = 2.064 t0.05 / 2,ν 2 = 2.040 24.4 2 57.612 × 2.064 + × 2.040 32 tα = 25 = 2.044 2 2 24.4 57.61 + 25 32 t tα P0.05, 拒绝H0，接受H1。可以认为正常人与喉癌患者的血清铁蛋白含量的差异有统计学意义，喉癌患者的含量高于正常人。假设检验的两类错误结论不拒绝 H0 拒绝 H0 线正确正确 Ⅰ型错误 II型错误正确假设检验的两类错误 ? Ⅰ型错误，第一类错误、假阳性错误 , 就是在假设检验作推断结论时，拒绝了实际上是正确的原假设H0，其概率用α表示。 ? Ⅰ型错误是针对原假设而言的，α就是事先规定的允许犯Ⅰ型错误的概率值，如规定 α =0.05 ，意味着在某特定总体抽样，100次拒绝 H0 的假设检验中，最多有5 次允许发生第一类错误。与此相应，推断正确的可能性为 1α，1-α又称为可信度。假设检验的两类错误 ? Ⅱ型错误，第二类错误、假阴性错误，即不拒绝实际上是不成立的 H0。就是无效假设原本是不正确的，但所算得的统计量不足以拒绝它，错误地得出了无差别的结论。 ? Ⅱ型错误是针对备择假设而言的，其概率值用β表示。β值的大小一般未知，只有在不同总体特征已知的基础上，按预定的 α 和 n 才能做出估算。检验效能 ? 1-β即指在备择假设正确的前提下，拒绝了实际上不成立的H0而做出正确推断的概率，又称为检验效能。 ? 其意义为当两总体确有差别，按规定的假设检验水准α所能发现该差别的能力。假设检验的两类错误 ? 统计推断中，α的取值是事先选定的，一般取 α=0.05或0.01。 ? 在样本含量固定的情况下，把α定0.01，就是允许产生1%第一类错误；把α定为0.05，就是允许产生5%第一类错误，前者比后者第一类错误的概率较小，但这时，第二类的错误就增大了。 H0 μ-σ -3 -2 -1 μ 0 β α μ+σ 1 H1 2 3 t α,v 假设检验的两类错误 ? 在样本量固定的情况下，减小α会引起β 增大；减小β会引起α增大。 ? 一般来说，定α=0.05是比较适宜的。 ? 若要同时减小α和β，只有增大样本含量。假设检验的注意事项 ? ? ? ? 要有严密的研究设计统计方法必须符合其适用条件正确表述统计推断结论注意对“阴性”结果的分析 ? 注意可信区间估计与假设检验的关系 ? 应注意统计学意义和专业意义的差别，有统计学意义并非一定有实际意义。 ? 拒绝 H0, 习惯上称 “ 显著 ”, 不应误解为相差很大，或在医学上有显著的实用价值；反之，不拒绝H0,习惯上亦称“不显著”，不应误解为相差不大，或肯定无差别。 ? 无论是拒绝H0，或不拒绝H0，都存在发生统计推断错误的可能，因此，推断结论不能绝对化。 ? 例：有人调查城市女婴出生体重(kg)，北方 5385人，均数为3.08，标准差为0.53；南方 4806人，均数为3.10，标准差为0.34。尽管出生体重均数仅相差 0 . 0 2 kg，但 t=2.93, P=0.0034，这是因为样本量很大。 ? 所以决不能因为P0.01差别有极显著意义而作出北方和南方城市女婴出生体重均数相差很大的结论。 ? “ 阴性 ” 结果是指经假设检验， Pα，得出差别无统计学意义的结论。此时只能表达为“尚不能认为两个（或多个）总体特征存在差别”，而不能下两总体相同或无差别的结论。 ? 若比较组间确有差别，因样本含量不足，也会出现 “ 阴性 ” 结果；当对比组间确无差别时，更有可能出现“阴性”结果。可信区间估计与假设检验的关系 ? 两者都是对总体特征进行推断的方法。区间估计用以说明参数量的大小，如推断总体均数所在的范围，而假设经验用于推论质的差别，如推断总体均数是否不同。 ? 可信区间不仅可回答假设检验的问题，而且可以比假设检验提供更多的信息，可信区间在解决假设检验问题基础上，还可获得是否有专业意义的信息。 ? 但可信区间不能完全替代假设检验，可信区间只能预先规定的检验水准下进行计算，而假设检验能够获得一个确切的P值。 (1) (2) (4) 有专业实际意义的值 (3) (5) H0 ? 有统计学意义（1）有专业意义（2）可能有专业意义（3）无专业意义 ? 无统计学意义（4）样本例数过少或误差过大（5）不拒绝H0 小结 ? ? ? ? ? 假设检验的基本原理和步骤单样本t检验配对设计资料的t检验两独立样本的t检验两类错误

【责任编辑：管理员】

上一篇：T+0_百度百科下一篇：OnePlus 7T Pro 迈凯伦限定版

随机推荐更多>>

t检验 入门教程ppt

时间:2019-10-29 来源：原创/投稿/转载作者：管理员点击: 162

t检验入门教程ppt