第4讲实验性研究定量数据统计策略(4): 多样本方差分析检验 t检验主要用于两组定量正态分布的数据比较,但是如果需要比较多组定量数据,t检验分析方法很可能不合适,此时,必须要借助另外一种方法,方差分析,英文缩写ANOVA(ANlysis Of VAriance)。 实例分析 在评价某临床新药耐受性及安全性的2a期临床试验中,对符合纳入标准的30名健康自愿者随机分为3组,每组10名。各组注射剂量分别为0.5U、1U、2U,观察48小时部分凝血活酶时间(s),试问不同剂量的部分凝血活酶时间有无不同?数据库见time48.sav 多组定量数据的比较,基本的方法有2种。一种是成组F检验,一种是多样本的非参数秩和检验(Kruskal Wallis秩和检验)。 究竟采用哪种方法,必须考虑"三个性"的条件:正态性、独立性、方差齐性。关于"三个性"的解释,可以看之前的文章,此处不再赘述:SPSS 统计分析策略(2): 两样本t检验 总的来说,方差分析针对两组或以上、定量、正态、独立、方差齐的数据比较。前面2个要求和多样本的非参数秩和检相同,差别在于F检验要求数据符合正态性、独立性、方差齐性三个要求。此外,如果细心的朋友可能会注意到,这里方差分析的条件是2组或以上,也就是方差分析不仅处理多样本,也同样可以处理2样本,关于这一点,我最后进行解释。 总结来说,对于本例: 本例采用随机化分组设计,独立性符合。 正态性方面,采用的是多样本正态性检验方法,探讨各组是否均来自于正态分布总体。经SW检验,0.5个单位P=0.531,1个单位P=0.250,2个单位P=0.605,没有统计学意义,三组数据正态性均符合。 方差齐性检验,在SPSS 操作F检验时同时进行。 SPSS 操作 1:
F检验SPSS操作界面: 分析—比较均值—单因素ANOVA检验 2:
F检验具体参数设置 "检验变量"放入活酶时间(time),"分组变量"放入分组(group),同时进行"定义组"。 ① 检验变量:即放入结局指标,本例为凝血活酶时间(time) ② 分组变量:放入group,无须如同t检验"定义组" ③ 选项:此处内容较为丰富,见下图: ① 描述:描述不同组的结局的均数、标准差、95%CI置信区间 ② 方差齐性检验:方差分析"三个性"条件之一 ③韦尔奇:这是一种F检验替代,用于方差不齐时进行使用。 ④平均值:大致比较多组之间的均数,意义不大。 3:
F检验分析结果及解释 根据上述SPSS操作,F检验统计分析以下结果: 第一,统计描述,给出均数、标准差、95%CI置信区间 第二,方差齐性检验。可选择第一行结果,结果显示方差齐性检验P=0.186,方差差不多一致。可采用F检验。 第三,F检验结果,结果显示F=0.63,P值=0.005,说明多组总体均数存在着统计学差异。 ①F值,为本表中两个均方值的比值(45.6/6.98=9) ②显著性,即P值 第四,韦尔奇检验,这是F检验的在方差不齐时的替代,Welch 检验,P值=0.002,意味着多组存在着统计学差异。 结果及表格的规范表达 根据上表,我们可以得到以下的规范的结论: 规范文字:0.5个单位剂量组平均凝血活酶时间为(36.6±2.3)s,1个单位剂量组平均凝血活酶时间为(37.8±2.2)s,2个单位剂量组平均凝血活酶时间为(35.1±3.3)s,三组时间总体均数存在着统计差异(F=6.5,P=0.005)。 规范的统计表(其中一种形式)为: F检验在统计分析中的实际应用 1.F检验结论取决于研究设计 F检验是最基本的假设检验方法,在随机、对照、平行的实验性研究中,F检验的结论十分可靠,完全证明一个干预措施是否真正产生效果,或者干预措施和定量结局是否存在着因果关系。 但是F检验如果用在观察性研究,比如比较男性、女性的体重有无差别,其结论不能说性别是体重的影响因素,只能说男性和女性体重存在着统计学差异,仅此而已。关于观察性研究F检验,后期再进行分析。 因此,同t检验一样,F检验结果到底能够说明什么问题,取决于研究设计。 2.两样本比较,也可以用F检验 很多时候,如果进行多次方差分析,多个方差分析结果需要呈现在同一表中,有些分组变量为二分类,有些是多分类,此时,需要同时包括t检验和F检验吗?其实不用,两样本比较,也可以用F检验,而且两样本t检验和两样本F检验的结果是一致的。 3.F检验"三个性"同t检验,是原则,不是铁标准 关于"正态性、独立性和方差齐性",与t检验一样,差不多即可,不用严格执行。总体上,独立性一般成组设计即可,无论是随机化设计还是自然成组,方差不齐,亦可以采用校正F检验(wetch检验),关键在于正态性。 当F检验遇见正态性问题 是否采用F检验,要看其指标理论上是何分布,直方图形态是否大致中间多或者两边少,观其是否极端异常值;正态性检验是辅助的作用。以下分析习惯,与t检验套路相同,仅供参考: 如果指标理论上属于偏态分布,则放弃F检验 如果该指标理论上属于正态分布,无论大小样本,该只要直方图大致中间多或者两边少,无特别异常值,均可采用F检验 如果指标理论分布不明确,但样本量较大(>100),该只要直方图大致中间多或者两边少,无特别异常值,均可采用F检验,无需考虑正态性检验结果。 如果指标理论分布不明确,但样本量不大(<100),若两组数据正态性检验p值均>0.01,可以考虑采用F检验,若至少一组<0.01,建议放弃F检验<!--100),若两组数据正态性检验p值均--> 无论大小样本,如果直方图呈一边倒趋势,或者存在若干个极端异常值,放弃F检验 最后,多组数据比较,任何一组P<0.05,均可以放弃F检验而选择秩和检验(但我也很少这么做) SPSS 课程视频和操作录屏 SPSS课程视频 带字幕去水印的视频可复制以下地址浏览器打开 https://evod.zcmu.edu.cn/resource.html?stationID=1&resourceid=415&isprivate=false&cateid=102 SPSS课程录屏 -本讲结束-,敬请阅读同期R语言教程推文- meta分析 R语言 真实世界研究 统计技巧