规范医学统计方法

统计方法的表述

如下表,内容包括: 所使用的统计软件及其版本; 检验水准; 实验数据为计数资料还是计量资料; 是否符合正态分布; 数据的表示方法; 方差是否齐性; 所选的检验方法及其依据。

对统计方法的表述范式如下: 本实验采用 SPSS 23. 0 软件进行数据处理。符合正态分布或近似符合正态分布的数据以平均值± 标准差( x ± s) 表示,若方差齐性多组间比较用单因素方差分析,组间两两比较用 LSD 检验; 多时间点的计量关联资料,采用重复测量资料的方差分析,如 P > 0. 05 说明满足球形假设,即重复数据之间存在相关性,可以使用重复测量资料的方差分析,若 P< 0. 05,说明不满足球形假设,需要对组内效应进行校正。不符合正态分布的数据用中位数( 四分位区间) [Md( P25,P75) ]表示,多组间比较采用 KruskalWallis H 秩和检验,组间两两比较则用 Bonferroni 法校正 P 值。无序计数资料组间比较采用卡方检验,若理论频数小于 5 的格子比例 < 20% ,采用Pearsonχ 2 检验; 若理论频数小于 5 的格子比例≥20% ,则采用 Fisher 精确检验。以 α = 0. 05 为检验水准或 P <0. 05 为差异有统计学意义。

统计结果的报告

凡在“方法”项下提及的结局指标都要提供数据。数值结果不能仅给出计算所得数值( 如百分数) ,还要给出其据以计算的绝对数,如它们有统计学意义,则要说明。统计结果在“结果”项下,简单的统计结果可用文字叙述形式,复杂的统计结果以表的形式表达,不要在正文中重复图表中的所有数据,仅需强调或概述最重要的观察结果。表格项目必须完整、有自明性,包括表题、表头、数据及表注。数据不仅仅包括各组数值,还要有统计量及 P 值。对常见的 t 检验、单因素方差检验、卡方检验、重复测量资料的方差分析、Kruskal-Wallis H 秩和检验举例说明。

t 检验

当 2 组连续性资料符合正态分布且方差齐性时,用成组 t 检验,统计量符号为 t。当资料不符合正态分布时,一般来说,有 2 个处理方法,一是进行转换,如对数转换,使之服从正态分布,然后对转换后的数据采用 t 检验; 二是采用非参数检验( Wilcoxon 检验) 。当资料符合正态分布而方差不齐时,也有 2 个处理方法,一是采用 t'检验,二是采用非参数检验( Wilcoxon 检验) 。表格内仅列出组间比较的统计量及 P 值,组内比较用配对 t 检验,统计量及 P值不列出,但要在表格内的相应数据上标注,表注中说明。见下表。

单因素方差检验

3 组及以上连续性资料符合正态分布且方差齐性时,用单因素方差分析( One-way ANOVA) ,统计量符号为 F。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有 LSD 检验、Bonferroni 法、tukey 法、Scheffe 法、SNK 法等。两两比较后有统计学意义,则在表格内的相应数据标注,在表注中说明,无需在表格内列出统计量及 P 值。见下表。

卡方检验

卡方( χ 2 ) 检验( Chi-square test) 用于 2 个或多个率或构成比之间的比较,数据性质为二分类或无序多分类计数资料。以 2 个样本率举例来说,可以将数据整理成 2 × 2 四格表,每个格子中的数字分别是 A 组样本阳性频次、A 组样本阴性频次、B 组样本阳性频次、B 组样本阴性频次,多个样本率的比较类似于 2 个样本率比较。如果 P < 0. 05 则说明至少有2 个率或构成比有差别。卡方检验的统计量为 χ 2 。见下表。

重复测量资料的方差分析

近年来越来越多的医学研究应用重复测量设计,包括数值变量重复、二分类重复和等级资料重复,但其中应用最多的是数值变量的重复测量,即比较 2 组( 如对照组与治疗组) 及以上( 对照组与不同药物剂量组)在3 个及以上时间点( 时间间距可相等也可不等) 的结果比较,其目的是研究各组的干预方法的结果是否有差异,在同一时间点各组的结果是否有差异,同组内不同时间点的结果是否有差异。统计量及 P 值有 3 组,即 F组间,P组间; F时间,P时间; F交互,P交互。见下表。

值得注意的是,当统计结果提示处理与时间不存在交互作用时,可进一步进行组间或观察时点主效应的两两比较。但如存在交互作用则无需再进行主效应分析,而是根据研究目的分析处理和( 或) 时间的单独效应。

Kruskal-Wallis H 秩和检验

Kruskal-Wallis H 秩和检验为一种非参数检验,用于 3 组及以上符合正态分布但方差不齐,或偏态分布的独立的连续变量的比较,及 3 组及以上独立的等级/有序变量的比较,统计量为 H。如果 H 在某个水平上超过了临界值,就表示至少有一组数据的波动水平与其他组有所差异。组间两两比较一般有2 种方法,一是将数据进行秩转换后,采用 SNK 检验,二是进行 Nemenyi 检验。两两比较的统计量及P 值不列出,只在比较的数据上标注,并在表注中说明。见下表。

常见错误分析

多时间点独立样本误用重复测量方差分析

有的人看到是多时间点且资料符合单因素方差分析,就用重复测量方差分析,关键在于没有把握是“关联资料”而非“独立资料”。如 50 只动物分别在 5 个时间点被等量处死检测同一指标,这是独立资料,则不属于重复测量方差分析应用范畴; 而动物分别在 5 个时间点不处死检测同一指标,这是关联资料,属于重复测量的方差分析应用范畴。值得注意的是,符合应用条件的 2 组样本比较是可以用重复测量方差分析的。

非技术性地使用统计学专业术语

非技术性地甚至被错误使用的统计学专业术语包括“正常”“显著”“相关”“协同”。如“经过给药后,体重恢复到正常水平”,应该表述为“给药组与正常组相比,体重差异无统计学意义”。“显 著”“非常显著”“极其显著”是被滥用最多的术语,当用P 表达时,对比组之间的差异不能表述为“给药组比模型组有显著( 非常显著、极其显著) 降低( 或升高) ”,而应当表述为“给药组与模型组比较,指标降低或( 升高) ,差异有统计学意义”。

当实验设计有不同药物浓度( 或剂量) 组时,作者往往根据不同组间比较差异有统计学意义而下结论“有剂量依赖性”或“有量效关系”,这样的结论是草率且没有统计学依据的,是否有量效关系必须进行相关或回归分析方能得出结论。

当实验设计有多个因素时,作者最常下的结论就是“有协同效应”。如对内皮细胞分别加载 12 h的 1. 2、12、24 dynes/cm2 层流剪应力,同时予以归芪比例为 1∶ 1、1∶ 3、1∶ 5 的中药干预,若欲得出“协同效应”的结论,应作 2 因素 4 水平的析因设计( 因素一: 当归补血汤 0、1∶ 1、1∶ 3、1∶ 5 共 4 个水平,因素二: 层流剪应力 0、1. 2、12、24 dynes/cm2 共 4 个水平) 进行方差分析,得出交互作用显著的分析后方可下此结论。

报告精确 P 值时 P = 0.000

当使用 SPSS 等统计软件进行数据分析时,如果P 值过小,统计软件就会报告 P = 0. 000 0,这并不是表示 P 值为 0,只是由于软件显示的限定对结果进行修约后才出现的,应描述为 P < 0.000 1 或 P< 0.001。

对所有定性资料均用卡方检验

定性资料包括二分类和无序多分类资料及有序/等级资料,只有前者用 Pearson 卡方检验或 Fisher’s 精确检验,而等级/有序资料应采取秩和检验,如比较西药组与中西药结合组患者的疗效是否有差别,此时疗效分为治愈、显效、好转、无效,为等级资料且为观察指标,应采用 Mann-Whitney U 检验。值得注意的是,在临床试验基线的比较时,即使观察指标为有序/等级资料,但是由于尚没有进行任何干预,一般仍视为无序资料,应用 Pearson 卡方检验或Fisher’s 精确检验。

本站 [ 羽儂医话 ] 内除注明转载文章,均为本人独立创作,采用「CC BY-NC-ND 3.0」创作共享协议。
原创不易,欢迎保留原文链接转载,原文链接:https://yunong.me/1736.html
THE END
分享
二维码
打赏
< <上一篇
下一篇>>