当前位置: 首页 > 头条 >

世界观察:“倾向得分方法”第五讲:基于R实现倾向得分加权

来源:哔哩哔哩    时间:2023-02-10 15:55:04

1.倾向得分加权原理

在上一讲中,我们基于SPSS和R分别构建了倾向性得分匹配数据,实现了回顾性研究的基线可比,达到了“事后随机化”的目的。

然而,很多同学发现,倾向性得分匹配降低了样本量,这不就意味着研究者辛苦搜集的数据不能全部利用了吗?


(资料图片)

别急,倾向性得分加权来了。

了解倾向性得分加权,需要先构建“标准化”的思想:即指定一个统一的“标准人口”,按照“标准人口”中混杂因素构成的权重来调整两组观察效应的平均水平,从而消除两组之间由于内部混杂因素分布不同对效应值的影响。

倾向性得分加权则是以倾向性得分为作为加权条件,在假定不存在其他未知混杂因素的前提下,通过假设每个观察对象均接受处理因素和均不接受处理因素的对比来调整数据。利用倾向评分估计的权重对各观察单位产生一个虚拟的标准人群,虚拟人群中两组混杂接近一致,近似于某一预先选定的标准人口分布。

倾向性得分加权根据标准人口选择的不同可以分为以下两种方法(其中Pt为整个人群中接受暴露/处理因素的比例,Ps为每个研究对象的倾向性评分)

1.逆概率加权(the inverse probability of treatment weighting,IPTW)以所有观察对象作为标准人群进行调整,暴露/处理组各观察对象的权重为Wt=Pt/Ps,对照组各观察对象的权重为Wc=(1-Pt)/(1-Ps)。

2.标准化死亡比加权法(the standardized mortality ratio weighting,SMRW)处理组观察对象作为标准人群进行调整,暴露/处理组各观察对象的权重为Wt=1,对照组各观察对象的权重为Wc=[Ps(1-Pt)]/[(1-Ps)Pt]。

加权后的数据在一定程度上控制了混杂,同时基本不改变样本量。本讲我们通过R语言实现倾向得分加权。

2.范文分析

JAMA一篇研究慢性肾病的大型队列研究中,就是基于倾向性得分开展加权,实现了基线数据的均衡可比。

本研究采用了IPTW的方法对原始数据开展加权。

匹配前基线数据显示很多标准化差值都超过了10%。

匹配前基线数据显示标准化差值都小于10%。

3.本讲案例

本讲案例来源同倾向性得分匹配一讲,诸位若有需要,可以发送关键词“文献阅读”到公众号,获取原文。

本数据探讨甲状腺乳头状癌右侧病灶大小与右侧喉返神经后方淋巴结转移的关系,是一项真实世界研究。结局变量为右侧喉返神经后方淋巴结转移,主要研究变量为甲状腺乳头状癌右侧病灶大小,其他变量有年龄、性别、右侧病灶数目、被膜侵犯等。

案例解析:

此案例暴露因素为甲状腺乳头状癌右侧病灶大小(<0.85cm=0,>0.85cm=1),结局是右侧喉返神经后方淋巴结转移(转移=1,未转移=0),此外还有一系列的协变量,这些变量可能是混杂因素。

4. 利用R语言进行倾向得分匹配

本文倾向性加权主要基于“survey”包开展。

详情请关注下方:

X 关闭

最近更新

Copyright ©  2015-2022 现在字画网版权所有  备案号:粤ICP备18023326号-5   联系邮箱:855 729 8@qq.com