我创建了一个for循环来构造一个包含特征的线性模型,并且在for循环的每一个循环中删除一个特征,使用这个for循环,我想取出每个特征的p值。
下面是我的伪数据和for循环:
#fake data
z <- c(0.91629, 1.32580, -1.09940, 0.33601, 0.28795, 1.59050, 0.68193, -1.5944, 0.32160, -1.30810, -3.8569)
x <- c(0.35391, -0.84966, 0.17623, 2.39960, -0.50007, 0.70983, 0.61825, -1.7655, -0.44426, 0.01343, 3.0556)
c <- c(1.32060, -0.29756, 0.60097, 1.91580, -0.13838, -1.77920, -0.625670, -0.30979, 0.86718, -0.27289, 2.9607)
v <- c(-0.49864, -0.61754, 0.17977, 1.17100, 0.77713, -0.50157, 0.021347, 1.32660, 0.11048, 0.79202, -1.3138)
b <- c(-0.39620, 1.30740, 1.09030, 0.45662, 0.48579, -0.17219, 0.387560, -0.98518, -0.47283, 0.27918, 8.7742)
n <- c(-0.79369, -0.050101, 0.89823, 0.80320, 0.32670, 0.39969, -0.547320, -0.23154, -0.46198, -0.25495, 1.1776)
L <- data.frame(rbind(z,x,c,v,b,n))
names(L) <- c("P1", "P2", "P3", "P4", "P5", "P6", "P7", "P8", "P9","P10", "SysResponse")
L
#my function
Remove <- c("P1", "P5", "P2", "P8", "P9", "P4", "P3", "P6", "P7", "P10")
for (i in 1:length(Remove)){
fit3 <- lm(as.formula(paste('SysResponse~',paste(Remove, collapse="+"))), data=L);
b <- summary(fit3)$coefficients[,4]; # p-value
print(b)
Remove = Remove[-1];
}
这将给出每个步骤中单个特征的p值。(忽略nans。我只是没能做出一个好的假数据。)
我在这里要做的不是把一堆数字作为输出,而是创建一个表,其中包含每个步骤中每个特征的p值。
所以我输出应该如下所示:
D1 D2 D3 ..... D10
P1 1 . .
P2 2 6 22
P3 3 8 45
P4 4 15 64
P5 5 17 .
P6 6 15 353
P7 7 11 12
P8 8 4 45
P9 9 96 23
P10 10 12 12
因为P1和P5将被移除。
接下来我可以尝试什么?
2条答案
按热度按时间knpiaxh11#
这就是你想要的吗?
iibxawm42#
请尝试以下代码:
PS:在您的示例中,train2未定义