楼上说的好,可以先看一下correlation matrix 来看各个variables之间的correlation,对其有一个初步的认知,哪些紧密联系哪些没啥联系。加哪些var不加哪些方法有很多,可以选择用forward selection or backward elimination,逐个排查,看加了或者减去那个var是否significant, 然后把data分成training and test samples, 建模fit几个models, 如linear regression, quadratic regression, logistic regression, 观察mse.