发帖回复
查看:15698|回复:27
When you buy via links in posts, huaren.us may earn a commission
Advertisement

问mm们一个统计建模中covariate的问题

头像
0操作21 #
头像
21 #
0
17-03-29 23:27操作
只看TAAA分享
模型里的confounder and effect modifier,加什么,怎么加, 看studydesign, 用到很多流行病统计知识
头像
0操作22 #
头像
22 #
0
17-03-29 23:29操作
只看TAAA分享
单就你举的例子来说,你的IV是treatment vs control,如果是random assignment to condition的话,理论上不需要放任何covariate。有时候N比较小,condition之间by chance会有些变量不平均,那么啥不平均你covariate就加啥。比如 实验组平均年龄高于对照组,那就在模型里加年龄
Advertisement
头像
0操作23 #
头像
23 #
0
17-03-30 00:14操作
只看TAAA分享
系统的说有很多feature selection的方法,前面jm们都说了。找本machine leaning的书里面讲的很清楚。不想那么麻烦的话,social scientists 经常用一种方法号称think it through,就是想想以前的研究都发现了哪些variables会影响DV,把他们加入作为covariates,然后看哪些不是significant,把那些去掉,再比较两种模型,看去掉以后的模型是不是更好一些。更正式一点就分成training set and test set, 比较两种模型。
头像
0操作24 #
头像
24 #
0
17-03-30 00:26操作
只看TAAA分享
Re...
单就你举的例子来说,你的IV是treatment vs control,如果是random assignment to condition的话,理论上不需要放任何covariate。有时候N比较小,condition之间by chance会有些变量不平均,那么啥不平均你covariate就加啥。比如 实验组平均年龄高于对照组,那就在模型里加年龄 woolala1202 发表于 3/29/2017 23:29:00 [url=http://forums.huaren.us/showtopic.aspx?topicid=74484563&postid=74484563#74484563][/url]
头像
0操作25 #
头像
25 #
0
17-03-30 00:31操作
只看TAAA分享
如果是randomized design的话,而你的目的是为了估计Treatment effect的话,加一些covariate可以让treatment effect的standard error更小一些,估计更精确一些。这些covariates之间correlation太大的话就属于multicolinearity的问题。一般就是三种思路:1. Backward/forward/stepwise selection, 2. Shrinkage methods: ridge/lasso, 3. PCA/PLS. 如果不是randomized design而你却是要估计treatment effect的话这就是属于causal effect on observational data了,有很多方法可以用来去掉confounding, 例如G-computation. 如果不管是不是randomized design, 你的目的是要做prediction的话,那就做cross validation,问题就简单的多了,哪个预测的好就用哪个
Advertisement
头像
0操作26 #
头像
26 #
0
17-03-30 01:20操作
只看TAAA分享
非统计专业的看了之后发现专业要求真不一样。lz做的这个在我们专业就是data mining了,上phd的时候是老师坚决反对的。我们的要求是先有自己的hypothesis以及为啥要选那些control variables,每个variable都有自己所代表的含义和以前study proved的解释,是不能随便试出来的加一个减一个的。
头像
0操作27 #
头像
27 #
0
17-03-30 03:50操作
只看TAAA分享
看看James heckman的东西吧 大多都是关于endogeneity的
头像
0操作28 #
头像
28 #
0
17-03-30 05:32操作
只看TAAA分享
LavaFlow说得真好。我也老犯data mining的错误。
发帖回复
查看:15698|回复:27
Advertisement
打开收藏板块打开个人中心
边缘侧滑返回