临床研究数据分析要点和在 SPSS 软件中的实现

临床研究中,不同类型的设计其数据统计分析的整体思路实则一致,均包括统计学描述和统计学推断两个 部分。临床研究数据统计分析方法的选择均基于变量类型,同时不同变量类型还须要根据其自身分布特点来进一步选择合适的指标和分析方法。本文将重点介绍临床研究数据统计过程中,研究者容易疏忽的细节,以及须注意的核心内容和易错点。

定量变量分布的正态性

临床研究数据统计分析实践中,许多研究者对定量变量直接选择均数±标准差进行描述,并应用t 检验或方差分析进行组间差异的统计学检验。如前文所述,对于定量变量统计分析方法的选择须首先考虑其是否符合正态分布,随后才能相应地选择合适的指标和统计学检验方法。正态性检验在 SPSS 软件中可以用“explore”模块实现。如下图所示, 选择“analyze →descriptive statistics → explore”后,在“dependent list”放入须要分析的变量(例如“b2a”), 然 后点击“plots”按钮,在“descriptive”处勾选“histogram”, 并将“normality plots with tests”勾选上,最后再选择 “continue → ok”即可。分析结果主要通过 Sig 值来判定,  Shapiro-Wilk 检验法对应的 Sig 值> 0.05 时,数据符合正态分布,频数图呈现“中间高,两边低,左右对称” 的特征。当 Shapiro-Wilk 对应的 Sig 值< 0.05 时,数据 将不符合正态分布。而 Kolmogorov-Smirnov 检验法则常用于样本量 n>2 000 时变量的正态性检验。

重复测量方差分析

RCT 中,研究者常常设置多个疗效评价时间点,对于这种类型的定量变量数据,不 能简单地使用不同评价时点测值与基线测量值之间开 展t 检验来评估疗效,这时候应该选择重复测量方差分 析,来分析不同组别、不同评估时间点干预措施临床疗  效差异的“组间效应”“时间效应”和“组间与时间交互  效应”。具体操作如下图所示,选择“analyze → general    linear model → repeated measures”,  在“define factors ” 中定义重复测量变量名称和次数,完成后点击“define” 按钮,在“within subjects variables”中放入重复测量变量,在“between subjects factors”中放入组别变量, 点击“plots” 定义绘图,在“post hoc”和“options”定义数据分析结  果展现内容,最后再点击“ok”即可。

χ2检验结果解读

对于定性变量组间比 较,通 常采用 χ2  检验。 如下图所示,选择  “analyze → descriptive statistics → crosstabs”, 在“rows ” 和“columns”处放入要分析的变量,点击“statistics” 按钮, 勾选“chi-square”,然后点击“continue → ok”即可。 这些操作过程对于研究者来说都比较熟悉,但须注意的是 :不能把四格表 χ2  检验结果的第一行直接拿来使用, 而是应该先看一下分析结果下方提示(“a.”“b.”“c.”)。 其中,第 1 条提示四格表中每个格子期望值的大小,进而可以帮助研究者选择合适的统计量和 P 值 :①当样本量n ≥ 40,同时格子期望值 T ≥ 5,选择“Pearson chi- square”对应的统计量和 P 值;②当样本量 n ≥ 40,但有 格子期望值 1 ≤ T < 5 时,采用连续性校正 χ2  检验,选 择“continuity correction”对应的统计量和 P 值 ;③当总 样本量 n < 40,或格子期望值 T < 1,采用 Fisher 确切概率法检验,即选择“Fisher’s exact test”对应的统计量与 P 值。

定量变量转换为定性变量

数据统计分析过程中, 有时候须要将定量变量转换为定性变量进行分析,如将患者的“实际年龄”根据一定的规则转换为“年龄组”, 这时候便要用到“transform”功能。如图,选择“transform → x-y recode into different variable”, 将须要进行转换的变量放入“numeric variable → output variable” 框, 在“output variable”中定义新的变量名 称, 点击“change” 进行转换,然后再 点击“old and new variable”打开一个新的对话框,在这个新对话框中,根据自己设定的规则,将定量变换转换为定性变量。 须 注 意 的 是,  尽 管“transform → x-x recode into same variable”也可以使用,但这样的操作会覆盖掉原始变量值,无法恢复。因此,建议研究者优先使用“x-y recode into different variable”转换新变量。

logistic 回归分析中多分类定性变量设置哑变量

在应用 logistic 模型进行回归分析时,如果自变量 中包含多分类定性变量,须将其设置为哑变量放入模型,否则统计分析结果展示的将不是各分类之间的差 别,而是 1/2/3/4 等数量之间的差异。如下图所示,选择“analyze → regression”,点击“binary logistic”打开对话框,在“dependent”框放入因变量, 在“covariates”框放入自变量,然后点击“categorical” 打开新的对话框,将须要设置为哑变量的变量名放入  “categorical covariates”,在下方“contrast”设定“indicator” 选择其余选项与第一个比(first)或其余选项与最后一  个比(last),随后再选择“continue → ok”即可。

本站 [ 羽儂医话 ] 内除注明转载文章,均为本人独立创作,采用「CC BY-NC-ND 3.0」创作共享协议。
原创不易,欢迎保留原文链接转载,原文链接:https://yunong.me/1536.html
THE END
分享
二维码
打赏
< <上一篇
下一篇>>