系统的说有很多feature selection的方法,前面jm们都说了。找本machine leaning的书里面讲的很清楚。不想那么麻烦的话,social scientists 经常用一种方法号称think it through,就是想想以前的研究都发现了哪些variables会影响DV,把他们加入作为covariates,然后看哪些不是significant,把那些去掉,再比较两种模型,看去掉以后的模型是不是更好一些。更正式一点就分成training set and test set, 比较两种模型。