可以先用correlation matrix简单看看各个variable之间有多大联系。model selection有很多方法,看你想设计多么复杂都行。至于你说的反客为主,不太理解,是说其他因素更加重要吗?问题是在现实问题中,很可能就是别的因素更加重要啊。尊重事实就是尊重模型。