临床研究数据集选择及数据分析原则
临床研究数据集选择
广义的临床研究包括描述性研究(现况研究、纵向研究、病例系列研究等)、分析性研究(病例对照、队列研究)、临床试验研究(社区试验研究、个体试验研究等)和数理研究(统计学建模、疾病转归预测等),而狭义的临床研究是指随机对照临床试验研究(randomized control trial, RCT)。无论是广义临床研究还是狭义临床研究,项目组完成研究数据的采集、清理和质量控制后, 都会产生数据库,也即是统计分析数据集。描述性和分析性临床研究均属于观察性研究范畴,研究者未对研究对象实施干预措施,而仅通过观察和测量收集研究对象的人口学、生活行为、疾病特征等数据信息。除前瞻性队列研究外,其他类别的观察性临床研究的研究周期短, 项目完成后通常仅形成一个数据库,后续统计分析将基于该数据库(数据集)开展,研究者只须描述清楚研究对象的应答率、在队列研究随访过程中的失访情况,而对于因失访而导致的数据缺失无须填补,后续通过比例风险回归分析等展示即可。
在临床试验研究中,研究者的目标为验证病因假设或评估干预措施的疗效和安全性,并综合考量研究周期、 经费、伦理等方面问题,其研究对象的规模相比于观察性临床研究往往要小很多,而且在研究对象筛选方面也十分严格,因此须要对入组的每一个研究对象给予充分重视。在研究对象招募阶段及整个研究全过程均须要与其保持密切沟通和联系,尽可能避免研究对象的脱落和失访,从而提高研究数据的完整性。鉴于临床试验研究的特殊性,理想的研究数据集应是包含所有入组对象在全研究周期内的所有数据,无漏填缺项,无失访与脱落。但在临床研究实践中,由于种种原因还是会出现研究对象脱落、数据采集不完整等情况, 所以在研究项目结束后, 须对最后形成的数据库进行判定和必要的技术修正,保证项目产生的有效数据的利用最大化。为此,临床研究专家和统计学家对 RCT 的数据库进行分类,包括意向性分析集(intention-to-treat population, ITT)、全分析集(full analysis set, FAS)和符合方案集(per-protocol analysis, PP)。
如上图所示,① ITT 纳入了所有随机化分组后的受试者进入分析,而不仅是实际完成的受试者。须注意的是,如果某受试者被随机分配到了 A 组,后续 ITT 分析中该患者也必须一直在 A 组,即便该受试者后来接受的是 B 组的治疗方案或没有接受任何治疗。这样做的目的是要保持两组间的基线特征均衡可比,使得除研究因素以外的其他变量完全均衡和匹配,能够充分观察干预效果。② FAS 是 ITT 的子集,是指对所有随机化受试者的数据做最少和公正的剔除后所得到的数据集,为的是保持原始数据集的完整性,减少偏倚。③ PP 则是 FAS 的 一个子集,是指研究对象均依从干预措施的数据集,即该子集内的受试者在纳入与排除标准、接受治疗、主要指标测量等方面不存在严重违背方案的情况。一般情况下,临床试验研究优先选择 FAS 进行统计分析,不过研究者也应报告基于PP的分析结果,将其作为补充材料 (supplementary material)放在文章附件中。相比于 PP, 基于 FAS 的数据分析更容易得到无统计学差异的结果,在非劣性或等效性临床研究设计时将会导致Ⅰ类错误风险的增加,研究者应给予充分关注,尽可能同时应用 PP 和 FAS 分析,综合评估临床研究中干预措施的疗效和安全性。
临床研究数据分析原则
临床研究数据统计分析至少应包括 4 个方面的内容:①对临床研究数据库中的变量定义或分类处理给出解释说明。如“吸烟率”“饮酒率”“治疗有效率”等应给出定义和计算方法 ;“年龄”“文化程度”“收入”等分类变量给出具体的分组和依据。②统计学描述内容,应对临床研究数据库中的定量变量和定性变量的给出详细描述方案。例如 :定量变量如符合正态分布,用均数± 标准差描述,如不符合正态分布,用中位数和四分位数间距描述 ;定性变量一般用率、构成比或百分比描述。③ 统计学检验和推断内容,同样应根据变量类型的不同, 给出具体的统计分析方案。例如 :定量变量如符合正态分布且方差齐,两组之间的比较采用t 检验,多组之间的比较采用方差分析 ;如方差不齐,两组之间的比较采 用 t ’检验,多组之间的比较先进行数据转换(对数变换、平方根变换、平方根反正弦变换等)再采用方差分析 ;如不符合正态分布,则选择非参数检验分析组间的差异。而对于定性变量,通常选择 χ2 检验、趋势 χ2 检验进行单因素分析,探讨两组或多组变量之间的差异 ;应用logistic 回归开展多因素分析,探索研究变量的独立危 险因素。④交代清楚数据分析所使用的统计学分析软件及检验水准。常用的统计学分析软件包括 SPSS 、SAS、 Epi-info 、Stata 和 R 软件等,检验水准一般设定为0.05 或 0.01,描述为“本研究以 P < 0.05 提示差异有统计学意义”或“本研究以 P < 0.01 提示差异有统计学意义”。 在优效性设计、非劣性设计中,因统计学检验为单侧, 检验水准调整为 0.025 或 0.005。
在临床研究数据分析结果呈现的内容方面,观察性临床研究(现况研究、病例对照研究、队列研究等)一 般应包括 3 个方面内容 :①研究对象的一般人口学特征, 以及与不同暴露组或不同病例分组研究对象一般人口学特征比较 ;②暴露因素和结局变量(疾病、死亡等)之间的单因素分析,包括潜在混杂因素与暴露因素和结局变量之间的单因素分析结果 ;③暴露因素和结局变量之间的多因素分析,以控制混杂因素,评估暴露因素与结局之间的单独效应。相比观察型临床研究,RCT 呈现的分析结果则更加“固定”,一般包括1张图和 3 个表,研究者可参考本《随机对照临床试验 CONSORT 声明解读》。其中, 1 张图为“随机对照临床研究各实施阶段流程图”(如下图), 3 个表分别为 :①受试者一般情况表,包括试验组和对照组 ;②主要疗效指标和次要疗效指标评估表 ;③安全性和不良反应情况表。
原创不易,欢迎保留原文链接转载,原文链接:https://yunong.me/1533.html


赤脚医生
写的真不错
Nono@赤脚医生
谢谢~~~