首 页 行业热点 新车 试驾评测 养车用车 车型库

倾向得分匹配可以分析纵向数据吗

发布网友

我来回答

1个回答

热心网友

摘要倾向得分加权:对实验组和对照组研究个体进行加权,从而使他们能够代表研究总体。然而,倾向得分加权仅在3种情况下最优:1)研究对象是且同分布的;2)选择是外生的;3)设定正确的预测变量和函数形式。实际上,即使预测变量和函数形式选择的好,也可能使估计的标准误偏小,此外,加权可能增加估计的因果参数上的偏差。骤3:我们可以使用步骤2匹配得到的新样本进行多元分析,主要有以下几种方法:1.贪婪匹配后的多元分析:在基于估计的倾向得分进行匹配后,实验组和对照组的研究个体在协变量上是均衡可比的,我们可以采用多元分析并且进行协变量调整。2.贪婪匹配后的分层:根据估计的倾向得分以升序排列样本,使用估计的倾向得分的分位数将研究个体分组,在每一组内计算实验组和对照组研究个体之间的差异。3.计算协变量不平衡的指数:使用协变量均值上的绝对标准化差值(absolute standardized difference, ASD)来比较最佳匹配前后协变量的平衡情况,ASD < 10% 表示实验组与对照组协变量均衡可比。4.最佳匹配后使用Hodges-Lehmann有序秩检验进行结果分析5.基于以最佳成对匹配所得样本的回归调整咨询记录 · 回答于2021-11-25倾向得分匹配可以分析纵向数据吗倾向得分匹配可以分析纵向数据吗您好,您可以在此查看哦https://blog.csdn.net/SeizeeveryDay/article/details/120775661看不懂。我只想知道是否能分析纵向数据。 能还是不能请稍等一会儿哦~倾向得分匹配可以分析纵向数据吗您好。您查看分析哦。https://zhuanlan.hu.com/p/2512871看不懂。可以直接回答我的问题吗亲。麻烦找到直接应用倾向匹配得分处理纵向数据的例子。谢谢步骤1:寻找混杂因素,因为这些因素导致实验组与对照组的不均衡。严格的倾向值建模总是从估计接受干预的条件概率开始。通过logistics回归模型来分析多个干预剂量的效应。这一步骤的分析目标是确定影响选择偏差的观测协变量并进一步为倾向得分模型中的变量设定函数形式。倾向得分是一个研究个体在给定的变量下成为实验组的条件概率,因此,实验组个体和对照组个体都具有非零的倾向得分。在这种情况下,一对具有相似倾向得分的实验组和对照组个体基本上被视为可比的,即使他们也许在具体协变量的取值上会有不同。步骤2:获得倾向得分后,研究者使用这些得分来匹配实验组个体和对照组个体。使用单个倾向得分的优点在于我们可以解决基于多个协变量进行匹配中出现的失败问题。由于估计的倾向得分所形成的共同支持域并不总是覆盖研究的全部研究个体,对于一些实验组个体,可能找不到相匹配的对照组个体,导致一些实验组个体的数据损失。因为这一特征,匹配被称作再抽样。即使原始样本中的实验组和对照组在观测变量中并不均衡,但基于倾向得分进行的再抽样会使实验组和对照组在观测变量上变得平衡。这一步骤的分析目标是使实验组和对照组的研究个体在倾向得分上尽量相似。匹配的类型:1.贪婪匹配:最常见的匹配算法,包括马氏距离匹配、使用倾向值的马氏距离匹配、最近邻匹配、卡尺匹配、卡尺内最近邻匹配、倾向值界定的某一卡尺内的最近邻的可得马氏距离匹配等。贪婪匹配的最大特征就是每一种方法都将一项大的决策问题(即匹配)区分成一系列可被最优地加以处理的更小、更简单的决策。每一次都只进行一项决策,且进行后面的决策时并不考虑前面已作出的决策。因此,贪婪匹配也有其局限性:它要求较大的样本量,且要求精确匹配时研究个体可能由于不完全匹配而损失,要求完全匹配时可能引起研究个体匹配不精确,这两种决策都不是最优的。即便如此,贪婪匹配,尤其是卡尺内的最近邻匹配以其独特的优势(允许研究者使用几乎所有类型的后续多元分析),被研究者广泛使用。2.最佳匹配:包括成对匹配、使用某一可变比值的匹配或可变匹配、完全匹配。该方法通过采用网络流方法来实现匹配优化。和贪婪匹配不同的是,最佳匹配旨在以最优化总距离的方式来识别匹配集合,且后面做出的决策将先前做出的决策也纳入考虑。实际上,后面的决策也可能改变先前的决策。倾向得分加权:对实验组和对照组研究个体进行加权,从而使他们能够代表研究总体。然而,倾向得分加权仅在3种情况下最优:1)研究对象是且同分布的;2)选择是外生的;3)设定正确的预测变量和函数形式。实际上,即使预测变量和函数形式选择的好,也可能使估计的标准误偏小,此外,加权可能增加估计的因果参数上的偏差。骤3:我们可以使用步骤2匹配得到的新样本进行多元分析,主要有以下几种方法:1.贪婪匹配后的多元分析:在基于估计的倾向得分进行匹配后,实验组和对照组的研究个体在协变量上是均衡可比的,我们可以采用多元分析并且进行协变量调整。2.贪婪匹配后的分层:根据估计的倾向得分以升序排列样本,使用估计的倾向得分的分位数将研究个体分组,在每一组内计算实验组和对照组研究个体之间的差异。3.计算协变量不平衡的指数:使用协变量均值上的绝对标准化差值(absolute standardized difference, ASD)来比较最佳匹配前后协变量的平衡情况,ASD < 10% 表示实验组与对照组协变量均衡可比。4.最佳匹配后使用Hodges-Lehmann有序秩检验进行结果分析5.基于以最佳成对匹配所得样本的回归调整

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com